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在 我 们 最 意 想 不 到 的 地 方 。 从 我 们 在 脸 书 (Facebook)〉 上 的 朋友 是 
谁 ， 到 我 们 的 信息 如 何在 几 暑 秒 内 通过 互联 网 传播 ， 这 一 切 的 背后 都 有 
着 有 趣 的 故事 ， 不 管 那 是 社交 了 网络、 通信 网 络 还 是 经 济 网 络 。 无 论 是 推 
荐 电影 ， 控 制 设备 的 功率 水 平 ， 还 是 视频 的 病毒 式 传播 ， 在 这 些 功 能 和 
其 他 功能 的 内 部 运作 中 都 隐藏 着 六 条 原则 ， 它 们 会 出 现在 各 种 各 样 的 网 
络 中 。 


本 书 运 用 通俗 易 懂 的 语言 ， 对 这 些 原则 以 及 网 络 的 力量 加 以 说 明 。 
许多 优秀 的 文章 已 经 从 数学 和 技术 角度 对 网 络 进行 了 详细 阐述 ， 但 本 书 
和 它们 不 一 样 。 


与 之 相反 ， 本 书 通过 故事 、 图 片 、 例 子 和 历史 逸事 描述 了 网 络 的 核 


官 丹 尼斯 -斯 特 里 格 尔 ， 以 及 “互联 网 之 父 ” 温 顿 . 琶 夫 和 罗伯特 : 卡 恩 的 对 
话 。 全 书 共有 数 百 张 图 片 ， 图 片 会 对 文本 加 以 补 序 。 我 们 还 会 将 网 络 和 
日 第 生活 的 其 他 方面 进行 类 比 。 你 可 能 会 惊讶 地 发 现 邮 政 系统 、 交 通 拥 
堵 和 停车 标志 ， 分 别 与 互联 网 路 径 选 择 、 网 络 拥 罕 和 Wi-Fi (无 线 局 域 
网 ) 随机 访问 非常 相似 。 


这 并 不 是 说 本 书 不 会 出 现任 何 数 学 知识 。 数 字 示 例 对 理解 驱动 网 络 
的 方法 非常 有 帮助 。 但 是 你 在 本 书 中 看 到 的 数学 知识 不 会 比 基 本 的 算术 
数字 的 相 加 和 相 乘 ) 更 复杂 。 想 要 阅读 本 书 ， 你 只 需要 有 和 学习 的 欲望 
印 可 。 


本 书 的 结构 是 什么 ? 它 分 为 六 个 部 分 ， 每 个 部 分 对 应 连接 我 们 生活 
中 的 六 条 网 络 原则 之 一 。 每 个 部 分 包含 两 到 三 章 ， 通 过 有 趣 的 主题 ， 讲 


述 相应 原则 的 故事 。 


那么 ， 这 六 条 原则 是 什么 ? 它们 简洁 明 了 ， 完 美 总 结 出 设计 、 建 造 
和 管理 网 络 的 方式 。 


原则 一 : 分 享 很 难 〈 第 一 部 分 ) 。 不 论 是 用 手机 打 电 话 还 是 用 Wi 
Fi 上 网 ， 痢 需要 分 享 网 络 媒 介 。 它 就 像 空 气 一 样 ， 你 需要 和 许多 其 他 人 
共 孚 。 在 这 种 情况 下 ， 怎 么 才能 不 干扰 彼此 的 连接 呢 ? 这 就 需要 有 效 的 
分 诗 和 协调 技术 一 一 从 控制 电话 传输 的 等 级 到 对 我 们 所 消费 的 数据 定 


站 


S 


原则 二 : 排序 很 难 (第 二 部 分 )。 今 天 的 许多 网 站 都 需要 处 理 大 量 
原始 数据 ， 以 找到 有 效 的 排序 方法 。 像 谷歌 这 样 的 搜索 引擎 如 何 对 呈现 
给 我 们 的 结果 进行 排序 ? 网 站 如 何 为 广告 商 分 配 空间 ? 随 着 需要 排序 的 
项 目 越 来 越 复杂 ， 排 序 工作 也 变 得 更 加 困难 。 


原则 三 ， 大 众 很 聪明 (第 三 部 分 ) 。 亚 马 逊 和 网 飞 (Netflix〉 等 在 
线 零售 及 娱乐 公司 拥有 很 多 顾客 。 我 们 是 人 否 能 够 对 大 众 的 意见 产生 影 
啊 ， 使 产品 评价 及 推荐 更 加 准确 和 有 用 ? 答案 是 肯定 的 ， 但 我 们 需要 对 
大 众 意 见 及 其 生成 机 制 做 一 些 特定 的 假设 。 


当 这 些 假设 站 不 住 脚 时 ， 就 需要 原则 四 : 大 众 并 不 那么 聪明 (第 四 
部 分 ) 。 为 何 有 些 视频 会 出 现 病毒 式 传播 ? 因为 人 们 可 以 影响 彼此 的 行 
为 和 决策 。 在 社区 网 络 中 ， 茶 些 人 是 否 比 其 他 人 更 具 影响 力 ? 是 的 ， 而 
且 他 们 的 影响 方式 并 不 一 定 很 直观 。 本 书 将 对 此 进行 解释 。 


分 而 治之 是 第 五 条 网 络 原则 (第 五 部 分 ) 。 通 过 这 一 概念 ， 互 联网 
的 规模 和 功能 可 以 有 效 地 增加 (从 路 径 选 择 到 数据 纠 错 ) 。 从 地 理 和 功 
能 上 ， 互 联网 都 被 巧妙 地 分 成 了 很 小 的 部 分 ， 因 此 每 部 分 都 可 以 被 单独 
管理 。 


原则 六 : 疾 到 端 (第 六 部 分 ) 。 这 是 最 后 一 条 原则 ， 它 主要 讨论 网 
络 如 何在 巨大 的 空间 里 运作 。 我 们 手中 的 终端 设备 往往 不 知道 ， 也 不 需 
要 知道 ， 互 联网 中 到 底 发 生 了 什么 ， 以 实现 分 配给 它们 的 各 种 功能 ， 例 
如 拥堵 控制 。 而 在 网 络 中 ， 执 行 一 项 任务 的 具体 位 置 是 一 个 重要 的 问 


题 。 


在 全 书 中 ， 你 将 看 到 参考 补充 材料 的 提示 。 补 充 材 料 可 在 本 书 的 网 
站 www.powerofnetworks.org 上 找到 。 材 料 按 章 节 划 分 ， 被 组 织 成 系列 问 
答 。 如 果 你 在 基本 了 解 原 则 以 外 ， 想 深入 挖掘 其 中 的 一 些 例子 、 历 史 和 
更 多 的 技术 信息 ， 可 阅读 这 些 材料 。 


除了 作为 大 众 科普 读物 ， 本 书 和 网 站 上 的 内 容 也 可 以 作为 大 学 或 高 
中 入 门 课程 的 基本 材料 ， 可 供 任何 专业 或 学 科 对 网 络 感 兴趣 的 学 生 使 
用 。 教 学 资源 可 以 在 本 书 的 网 站 上 获取 ， 也 可 以 发 送 电子 邮件 给 我 们 

(地 址 leamPoN@gmail.com) 。 事 实 上 ，2013 年 以 来 ， 本 书 中 的 很 多 材 
料 已 经 被 用 在 大 规模 开放 网 络 课程 (Massive Open Online Course， 茶 
课 ) 上 ， 有 超过 100 000 名 学 生 学 习 过 。 


我 们 从 写作 本 书 中 获得 了 很 多 乐趣 ， 和 希望 你 也 能 从 阅读 本 书 中 获得 
乐趣 ! 


oe 
分 享 很 难 


花 几 秒 钟 ， 坐 下 来 想象 一 下 ， 如 果 没 有 手机 ， 你 的 生活 将 会 怎 
样 。 这 可 能 很 困难 ， 因 为 每 次 联系 老板 或 家 人 ， 或 者 跟 任 何人 远程 沟 
通 ， 你 都 只 能 使 用 固定 电话 。 然 后 再 往 前 想 ， 回 到 家 里 有 电话 以 前 。 
在 那个 时 候 ， 信 息 传 播 的 速度 ， 仅 等 于 你 或 邮递 员 在 街道 之 间 步 行 的 
速度 、 火 车 在 城市 间 行 驶 的 速度 ， 或 是 货船 在 大 陆 间 跨 海航 行 的 速 
度 。 虽 然 很 难 想象 ， 但 这 就 是 在 有 线 和 无 线 通信 出 现 之 前 ， 人 们 数 千 
年 来 的 生活 方式 。 这 些 技术 使 通信 速度 大 大 加 快 ， 同 时 也 给 网 络 资源 
如 何在 这 么 多 人 之 间 实 现 “ 共 享 ”， 带 来 了 许多 有 趣 的 挑战 。 


在 本 书 第 一 部 分 ， 我 们 将 探讨 两 种 无 线 网 络 : 蜂窝 〈 第 1 章 ) 和 
Wi -Fi (第 2 章 ) 。 在 研究 这 些 网 络 时 ， 我 们 将 看 到 两 种 共享 通信 资 
源 ( 在 这 种 情况 下 ， 是 指 空气 中 的 电磁 频谱 ) 的 方式 ， 以 此 进行 通 
信 。 控 制 干扰 是 关键 : 这 需要 使 用 方法 ， 在 后 台 分 析出 你 进行 通信 的 
时 间 和 音量 。 


网 络 定价 〈 第 3 章 ) 也 可 以 是 一 个 实现 更 高 效 资源 共享 的 有 效 方 
式 。 我 们 将 看 到 网 络 供应 商 使 用 的 方法 ， 来 确定 我 们 为 消费 的 数据 支 
付 多 少 费用 。 


第 1 章 
控制 你 的 < 音量 ” 


如 今 ， 手 机 已 成 为 我 们 日 常生 活 的 一 部 分 。 图 1-1 显 示 了 部 分 国家 
在 2015 年 年 中 的 手机 渗透 率 (mobile penetration) ， 即 各 国平 均 每 
人 拥有 的 手机 数量 。 请 注意 ， 最 左 侧 5 个 国家 的 渗透 率 均 超过 100%， 说 
明 在 这 些 国 家 ， 手 机 数量 超过 了 人 口 数量 。 


此 外 ， 在 2015 年 年 中 ， 图 1-1 中 的 13 个 国家 均 拥 有 超过 1 亿 的 手机 入 
网 量 。 同 一 时 期 ， 全 世界 手机 入 网 量 超过 6 800 000 000 (68 亿 ! )。 


既然 数量 如 此 巨大 ， 你 也 许 会 本， 我 们 如 何 能 有 效 地 进行 无 线 通 
信 ， 而 不 会 干扰 彼此 通话 、 收 发 信息 及 上 网 ? 我 们 将 在 本 书 这 一 部 分 分 
享 几 种 方法 ， 本 章 首 先 介绍 功率 〈 通 话音 量 ) 控制 。 


现代 移动 蜂窝 (cellular) 系统 是 几 十 年 来 技术 革新 的 产物 。20 世 
纪 40 年 代 人 至 80 年 代 ， 移 动 设备 尚 属 奢侈 品 ， 而 到 了 21 世 纪 ， 则 变 成 了 必 
需 品 。 伴 随 这 一 趋势 ， 工 程 师 们 必须 想 出 能 让 人 们 进行 无 线 通 信 的 不 同 
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注 : 图 为 截至 2015 年 6 月 ， 部 分 国家 的 手机 渗透 率 ， 即 平均 每 人 拥有 的 手机 数量 。 其 
中 6 个 国家 的 渗透 认为 100% 或 以 上 ,说明 这 些 国 家 的 手机 数量 超过 人 口 数量 


从 电话 到 手机 


在 无 线 网 络 和 手机 出 现 之 前 ， 通 信和 网络 主要 依靠 有 线 (wireline) 
手段 ， 即 利用 线 绕 进行 通信 ， 与 之 相对 的 是 无 线 (wireless) 通信 。 早 
在 1876 年 10 月 9 日 ， 通 过 从 波士顿 到 坎 布 里 奇 的 一 段 2 英里 三 长 的 线 费 ， 
亚历山大 -格雷 厄 姆 :贝尔 拨打 出 了 世界 上 第 一 通电 话 。 第 二 年 ， 贝 尔 电 
话 公司 成 立 。 那 是 第 一 家 提供 公共 交换 电话 网 络 (public switched 
telephone network) 服务 的 公司 〈 我 们 通常 称 之 为 “固定 线路 ”) 。 


在 设计 电话 前 ， 贝 尔 正在 对 此 前 发 明 的 电报 进行 实验 。 利 用 “复式 
电报 机 ”， 多 个 发 送 者 (transmitters， 信 息 发 出 方 ) 和 接收 者 
(receivers， 信 息 接 收 方 ) 能 够 通过 一 条 线路 进行 联系 。 


试想 一 下 : 我 们 如 何 能 像 图 1- 2 那样 ， 让 许多 人 使 用 同一 条 线路 
呢 ? 假如 安娜 和 本 正 试 图 通话 ， 查 理 和 达 娜 也 是 ， 这 难道 不 会 导致 他 们 
干扰 彼此 的 通话 吗 ? 


安娜 . 
' 线路 
六 本 

会 理 达 娜 

图 1-2 


注 : 假设 安娜 正在 和 本 打 电 话 ， 查 理 正 在 和 达 娜 打 电 话 ， 两 对 通话 者 如 何 能 在 使 用 
同一 条 线路 时 ， 不 互相 干扰 呢 

其 实 未 必 。 虽 然 他 们 在 使 用 同一 个 空间 (电话 线 ) ， 但 我 们 可 以 在 
其 他 层面 把 他 们 分 开 。 最 直接 想到 的 或 许 是 时 间 : 让 安娜 和 本 占用 一 会 
儿 电 话 线 ， 然 后 让 得 理 和 达 娜 用 一 会 儿 ， 再 让 安娜 和 本 用 ， 如 此 反复 。 
我 们 还 可 以 试 着 用 语言 来 区 分 : 让 安娜 和 本 说 英语 ， 但 理 和 达 娜 说 西 班 
牙 语 。 这 样 他 们 就 能 同时 通话 ， 只 需要 听 目 己 的 语言 就 行 。 即 便 如 此 ， 
我 们 还 是 要 担心 不 同 的 说 话 声 会 盖 住 彼此 。 


这 些 层面 一 一 时 间 和 语言 ， 是 不 同 多 址 联 (multiple access) 技 
术 的 简化 例子 。 这 些 技术 使 多 个 通话 者 能 共用 同一 网 络 媒 介 (如 电话 线 


和 无 线 信号 ) 。 我 们 将 在 本 章 对 其 进行 深入 探讨 。 
按 不 同 频 紊 进行 共享 
复式 电报 机 根据 不 同 频率 ， 利 用 频 分 多 址 (frequency division 
multiple access，FDMA) 将 不 同 连接 进行 区 分 。EDMA 会 为 每 组 发 
送 者 和 接收 者 〈 称 为 一 个 “链接 ”) 分 配 一 个 频道 (frequency 
channel) ， 使 其 能 进行 联系 。 你 可 以 在 图 1-3 中 看 到 图 示 。 
KE 


时 间 
图 1-3 


注 : 通过 频 分 多 址 ， 根 据 通 话 的 指定 频道 对 其 进行 区 分 : 通话 一 的 用 户 被 分 到 一 个 
频道 ， 通 话 二 的 用 户 被 分 到 另 一 个 频道 ， 以 此 类 推 


“频率 ”是 什么 ? 对 于 我 们 能 听 到 的 频率 ， 可 以 理解 为 声音 的 不 同音 


调 。 频 率 以 赫兹 (hertz，Hz) 为 单位 进行 衡量 ， 表 示 声 波 平均 每 秒 完 
成 的 循环 次 数 。 因 此 10 赫 效 表示 声波 每 秒 完成 10 次 循环 〈 见 图 1-4) 。 
关于 频道 的 更 多 信息 ， 请 参见 本 书 网 站 的 Q1.1 部 分 。 


频率 单位 将 在 本 书 此 部 分 多 次 被 提 到 ， 但 我 们 即将 探讨 的 频率 范围 
远 远 超过 一 赫 效 的 数量 级 。 通 利 提 到 的 无 线 频带 为 数 晶 万 炙 效 或 数 十 亿 
赫 效 ， 分 别称 为 兆赫 〈MHz) 和 千 兆 赫 〈GHz) 三 。 为 了 帮助 你 理解 这 
些 数 字 的 概念 ， 人 类 能 听 到 的 最 高 频率 为 大 约 20 000 赫 兹 。 


-一 1 赫 效 --- 3 赫 效 


时 间 ( 秒 ) 


图 1-4 

注 : 不 同 频 率 的 两 条 声波 ， 表 示 平 均 每 秒 完成 的 循环 次 数 。 实 线 波 频 率 为 1 森 座 ， 虚 
线 波 频率 为 3 赫 效 

第 一 代 移 动 电 话 始 于 20 世 纪 二 三 十 年 代 ， 运 用 了 FDMA 技 术 。 它 们 
在 本 质 上 是 模拟 (analog) 的 ， 也 就 是 说 ， 它 们 的 信号 完全 以 电 的 形 
式 从 空中 穿 过 。1946 年 ， 贝 尔 电话 公司 建立 第 一 套 “ 移 动 电话 ”网 络 ， 称 
为 “移动 电话 服务 系统 ”。 这 套 系 统 与 1964 年 出 现 的 新 一 代 系统 一 样 ， 都 
是 FDMA 系 统 。 它 们 被 认为 是 第 零 代 技术 ， 也 叫 作 0G， 与 之 相对 的 是 
我 们 现在 使 用 的 4G 技 术 。 


第 一 台 手 持 电话 


20 世 纪 70 年 代 ， 摩 托 罗 拉 公 司 的 马丁 ' 库 珀 坚信， 手持 电话 将 成 为 
未 来 的 潮流 。1973 年 ， 他 带领 团队 花 了 90 天 ， 制 造 出 史上 第 一 台 手 持 电 
话 : DynaTAC。 


DynaTAC 并 不 像 今 天 的 手机 。 它 重 达 近 2 磅 ( 约 0.9 干 殉 ) ， 价 格 接 
近 3 000 美 元 (1973 年 的 美元 价值 ! ) ， 通 话 30 分 钟 便 需要 充电 。 相 比 
之 下 ，2016 年 的 一 台 苹 果 手 机 重量 不 到 1/3 人 磅 〈( 约 0.15 和 干 克 )〉 ， 价 格 可 低 
至 150 美 元 (取决 于 具体 型 号 和 无 线 网 络 合同 ) ， 并 且 每 次 充电 后 可 供 
数 小 时 通话 及 数据 应 用 使 用 。 


直到 20 世 纪 90 年 代 中 期 ， 手 持 电话 产业 才 真 正 开 始 脱离 车 载 电话 。 
与 数字 网 络 类 似 ， 只 有 当 电 子 元 件 成 本 开始 大 幅 下 降 ， 手 擎 大 小 的 电话 
才 变 得 实际 。 而 电子 元 件 成 本 下 降 ， 部 分 是 因为 需求 上 升 。 需 求 之 所 以 
上 升 ， 部 分 是 因为 这 些 技术 的 应 用 增加 了 。 


“蜂窝 电 寺 99 的 “ 蜂 寅 ” 


1976 年 ， 仪 纽约 市 就 有 大 约 500 名 手机 用 户 ， 在 等 待 名 单 上 的 人 数 
超过 这 个 数字 的 6 倍 。 网 络 容量 (capacity) 急需 扩大 。 那 么 ， 网 络 运 
营 商 能 做 什么 呢 ? 实际 上 只 有 两 种 选择 : 请 求 联邦 通信 委员 会 〈Federal 
Communications Commission， 人 简称 FCC) 提供 更 多 频谱 ， 或 找 出 一 种 方 
法 ， 使 更 多 用 户 能 使 用 同一 频谱 。 


有 关 FCC 许 可 过 程 的 更 多 信息 ， 请 查看 本 书 网 站 的 Q1.2 部 分 。 如 何 
让 更 多 的 用 户 共 享 同 一 频谱 ? 也 许可 以 重复 使 用 频道 ?这 似乎 有 点 儿 牵 
强 : 如 果 有 两 个 链接 紧 挨 着 彼此 ， 又 在 使 用 相同 的 频道 ， 肯 定 会 产生 干 
扰 。 但 是 ， 如 果 它 们 不 在 彼此 劳 边 呢 ? 如 果 它 们 距离 足够 远 ， 那 么 可 以 
重复 使 用 同一 个 频道 吗 ? 


答案 是 肯定 的 。 当 信和 号 


通过 空 (以 及 通过 线 统 ) 传播 ， 其 功率 电 
平 会 衰减 (attenuate) 。 


这 音 味 着 它们 会 随 着 距离 增加 而 减 小 ， 如 图 


1-5 所 示 。 
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注 : 当 信 号 通过 空气 传播 ， 其 功率 电 平 会 衰减 。 在 安娜 的 手机 周围 ， 她 的 手机 发 射 
功率 电 平 是 100。 当 信号 到 达 本 时 ， 功 率 电 平 是 50。 到 达 查 理 时 ， 是 10 


通常 情况 下 ， 衰 减 极 看 作 是 一 件 坏事 。 它 会 导致 信号 减弱 ， 使 其 难 
以 远 距 离 传送 。 但 这 正 是 我 们 所 需要 的 :如果 你 和 我 相距 足够 远 ， 我 们 


就 都 可 以 打 电 话 ， 而 且 也 不 会 导致 信号 在 空中 重 登 。 


衰减 的 特性 使 得 工程 师 开 始 从 地 理 上 把 移动 信号 区 划分 为 一 个 个 蜂 
窝 (cell) ， 通 常 表示 为 “六 边 形 ”>。 这 个 想法 是 ， 任 何 指定 的 蜂 帘 都 可 
以 被 分 配 一 组 不 被 相 邻 蜂 视 使 用 的 频率 。 这 样 ， 使 用 同一 频 关 的 蜂 谢 将 
距离 彼此 很 远 ， 不 会 产生 干扰 ， 使 我 们 能 够 更 有 效 地 使 用 现 有 的 资源 。 


你 可 以 在 图 1-6 中 看 到 蜂 祸 网络 的 示例 。 在 这 里 ， 任 何 具 有 相同 颜 
色 的 六 边 形 将 被 分 配 相 同 的 频率 ， 因 为 它们 不 相 邻 。 假 如 颜色 最 深 的 得 
到 频道 1 至 4， 颜 色 深 度 居中 的 得 到 5 至 8， 颜 色 最 浅 的 得 到 9 至 12。 罗 布 
在 深 色 蜂 贸 里 ， 位 于 频道 2。 在 他 的 蜂 离 里 的 其 他 人 可 能 处 于 1、3 或 4 频 
道 。 由 于 蕾 切 尔 是 在 男 一 个 深 色 蜂窝 里 ， 因 此 她 也 可 以 被 分 配 到 频道 
2， 因 为 她 距离 足够 远 。 本 在 中 间 的 蜂 富 ， 则 不 能 得 到 频道 |， 因为 他 太 
接近 深 色 蜂 富 。 我 们 为 不 同 蜂 祝 指定 颜色 (频率 ) 时 ， 经 常 想 让 使 用 的 
颜色 数量 尽 可 能 小 。 找 到 那样 的 颜色 组 合 实 际 上 是 相当 困难 的 ， 特 别 是 
当 图 中 单元 格 的 数目 变 得 非常 庞大 时 。 
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图 1-6 


注 : 这 是 一 张 蜂窝 网 络 图 。 每 个 单元 都 是 一 个 六 边 形 ， 包 括 多 个 移动 站 (MS) 和 基 
站 (BS) 。 单 元 格 的 颜色 深度 表示 单元 格 使 用 的 频带 。 相 邻 两 个 单元 格 没 有 相同 的 
颜色 ， 因 此 使 用 不 同 的 频带 以 防止 干扰 


那么 每 个 蜂 宫 里 有 什么 ? 有 基站 (base stations) ， 也 叫 BS， 以 


及 移动 站 (mobile stations) ， 也 叫 MS。 每 个 蜂窝 的 基站 一 端 连接 
有 线 核心 网 和 互联 网 ， 另 一 问 连 接 分 配给 它 的 移动 站 。 移 动 站 可 以 是 一 
部 手机 、 一 台 平 板 电 脑 ， 或 任何 可 以 根据 蜂 色 标准 发 送 和 接收 信号 的 设 
备 。 


单元 首先 在 先进 的 移动 电话 系统 中 使 用 ， 标 志 着 1G 技 术 在 美国 的 
诞生 。 在 这 个 系统 中 ， 移 动用 户 数量 狐 增 。 到 20 世 纪 90 年 代 ， 仅 在 美国 
就 有 2 500 万 名 手机 用 户 。 这 也 意味 着 ， 由 于 高 使 用 率 和 低 容 量 ， 模 拟 
信号 已 经 无 法 满足 需求 。 


进入 数字 时 代 

随 着 模拟 网 络 再 次 变 得 拥挤 ， 美 国 和 其 他 各 国 开始 尝试 另 一 种 选 
择 : 数字 (digital) 系统 。 模 拟 信号 将 被 “数字 化 >”， 转 换 成 二 进 制 位 的 
序列 ， 即 1 和 0 〈 见 图 1-7) 。 


借 拟 信号 


011000110110111 


图 1-7 


注 : 模拟 信号 随 着 时 间 不 断 变化 。 与 之 相反 ， 数 字 信 号 是 一 系列 的 二 进 制 位 ， 即 1 和 
0 


数字 系统 在 容量 上 拥有 巨大 优势 ， 因 为 它们 使 用 了 另外 两 个 我 们 将 
讨论 的 多 址 联接 技术 。 在 20 世 纪 80 年 代 末 之 前 ， 建 立 这 些 网 络 所 需 的 小 
规模 电子 设备 成 本 还 不 够 低 。 


按照 时 间 《〈《 和 频率 ) 进行 共有 


从 模拟 到 数字 蜂窝 的 转换 标志 着 1G 技 术 发 展 到 了 2G。 第 一 套 2G 技 
术 标 准 是 全 球 移 动 通信 系统 ， 简 称 GSM， 始 于 1982 年 。 到 1987 年 ， 该 系 
统 容量 便 达 到 模拟 系统 的 3 倍 。 


数字 代码 使 我 们 能 将 多 个 通话 压缩 到 一 个 频段 。 所 以 ， 即 使 在 一 个 
单元 里 ， 我 们 也 可 以 让 很 多 人 共用 同一 个 频道 。 我 们 只 需要 添加 力 一 个 
维度 。 最 明显 的 额外 维度 选择 是 时 间 。 


换 句 话说 ， 多 个 用 户 可 以 共享 同一 个 频道 ， 但 他 们 必须 轮流 使 用 。 
按照 一 套 叫 作 时 分 多 址 (time division multiple access， 简 称 
TDMA) 的 方案 ， 每 人 被 分 配 到 不 同 的 时 段 。 你 可 以 在 图 1-8 中 看 到 
TDMA 的 一 个 例子 。 
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图 1-8 
注 : 利用 时 分 多 址 ， 一 定数 量 的 通话 (图 中 为 3 个 ) 可 以 共享 相同 的 频道 。 例 如 ， 通 
话 A、B 和 C 被 分 配 到 相同 的 频道 ， 但 在 时 间 上 是 分 开 的 

由 于 欧盟 倾向 于 发 展 一 套 共 同 的 标准 ，GSM 在 欧洲 很 多 地 区 被 迅速 
采纳 。GSM 今 天 仍然 在 世界 部 分 地 区 使 用 ， 主 要 在 900MHz 和 1 800MHz 
频段 运行 。 这 降低 了 手机 成 本 ， 标 志 着 手机 发 展 进 入 新 阶段 ， 能 提供 短 
信 、 游 戏 ， 以 及 其 他 娱乐 功能 。 


按照 代码 进行 共 竺 


在 美国 ， 采 用 2G 标 准 的 历程 更 有 趣 。 在 了 解 对 容量 的 需求 增加 
后 ， 美 国 蜂 视 电 信行 业 协 会 在 1988 年 发 布 了 一 系列 性 能 要 求 ， 规 定 通信 
行业 应 致力 于 达到 第 一 套数 字 蜂 寅 标准。 其 中 的 主要 要 求 是 ， 容 量 应 达 
到 传统 模拟 网 络 的 10 倍 。 


这 个 时 候 ， 几 乎 所 有 美国 的 网 络 运营 商 和 设备 制造 商都 党 得 TMDA 
是 最 好 的 办 法 ， 但 高 通 〈(Qualcomm) 公司 例外 。 该 公司 倡导 另 一 项 技 
术 码 分 多 址 (code division multiple access， 简 称 CDMA) 。 
如 图 1-9 所 示 ， 在 CDMA 系 统 中 ， 用 户 在 “代码 ”维度 上 进行 区 分 ， 在 时 


闻 和 频率 上 则 不 加 区 分 。 对 代码 最 好 的 类 比 可 能 是 语言 : 就 像 给 每 个 链 
接 不 同 的 语言 ， 然 后 让 它们 进行 通话 一 样 。 


时 间 


代码 
图 1-9 

注 : 通过 码 分 多 址 ， 通 话 按照 “代码 ”维度 进行 区 分 。 所 有 通话 可 以 在 相同 的 频率 
和 时 间 进 行 ， 因 为 网 络 中 的 每 个 传输 都 会 被 分 配 到 唯一 的 代码 

每 个 代码 都 像 一 把 钥匙 。 发 送 方 锁定 消息 ， 将 其 发 送出 去 ， 并 且 只 
给 接收 方 发 送 密 钥 。 设 计 这 些 代码 的 困难 在 于 ， 应 该 只 有 一 把 钥匙 能 
够 “解锁 ”任何 指定 信号 。 如 果 另 一 个 接收 方 试图 用 自己 的 钥匙 解密 该 消 
息 ， 则 应 该 显示 为 噪声 。 每 一 个 代码 会 “取消 ? 另 一 个 ， 具 有 此 属性 的 代 
码 集合 被 称 为 一 个 正 交 码 (orthogonal codes) 族 。 关 于 CDMA 的 更 
多 信息 ， 请 参考 本 书 网 站 的 Q1.3 部 分 。 


一 开始 有 人 预测 ，CDMA 能 提供 的 容量 可 以 比 传 统 模拟 网 络 大 40 倍 


以 上 上。 尽管 如 此 ， 当 时 大 多 数 工程 师 、 制 造 商 以 及 运营 商都 抵制 
CDMA。 原 因 之 一 是 ， 当 时 尚未 有 CDMA 蜂 帘 网 络 原型 ， 对 其 进行 演 
示 。 


1989 年 ， 蜂 窝 电 信行 业 协 会 投票 通过 ， 将 TDMA 作 为 美国 第 一 个 2G 
数字 标准 。 未 来 4 年 中 ， 需 要 更 多 的 概念 证 明 ，CDMA 才 会 得 到 批准 。 


鸡尾酒 会 的 比喻 


这 里 有 一 个 易于 理解 的 比喻 ， 能 阐明 一 些 我 们 已 经 介绍 过 的 技术 。 
假设 一 场 鸡尾酒 会 在 一 座 有 许多 房间 的 大 厦 举行 ， 其 中 有 许多 谈话 发 
生 。 假 如 聚会 上 有 很 多 人 ， 如 果 大 家 都 挤 在 同一 个 房间 ， 同 时 说 话 ， 我 
们 将 很 难听 清 目 己 的 对 话 内 容 。 我 们 让 主人 来 确定 应 对 这 一 局 面 的 最 好 
方式 。 


主人 首先 决定 ， 每 个 房间 里 可 以 有 两 个 人 谈话 。 每 对 谈话 者 符 在 目 
己 的 房间 ， 直 到 谈话 结束 ， 所 以 每 个 人 都 能 以 合适 的 首 量 说 话 ， 因 为 声 
首 传 到 其 他 房间 时 会 减弱 。 但 如 果 我 们 把 房间 看 成 单元 ， 这 就 好 比 每 个 
单元 每 次 只 允许 有 一 个 连接 。 考 虑 到 客人 数量 很 可 能 比 房间 数 多 ， 这 种 
安排 将 无 法 令 许 多 没有 分 配 到 房间 的 谈话 者 满意 。 


为 了 处 理 这 个 容量 问题 ， 主 人 决定 允许 许多 谈话 者 共用 一 个 房间 
《 即 每 单元 多 人 ) ， 让 每 对 谈话 者 在 不 同 的 时 间 交 谈 。 因 此 ， 在 任何 指 
定 房间 里 ， 第 一 对 谈话 者 可 能 有 30 秒 交谈 ， 此 时 其 他 人 保持 沉默 ， 然 后 
是 下 一 组 ， 以 此 类 推 。 同 样 ， 每 个 人 都 可 以 尽情 地 大 声 说 话 ， 因 为 声音 
不 会 盖 住 别人 的 谈话 。 这 是 TDMA 的 一 个 例子 ， 在 每 个 房间 里 ， 每 段 谈 
话 都 被 分 配 到 一 个 单独 的 时 段 。 


如 果 不 是 分 配 时 段 ， 假 设 主 人 让 每 个 房间 里 的 每 对 谈话 者 使 用 一 门 
单独 的 语言 。 那 么 ， 大 家 都 可 以 同时 说 话 ， 因 为 每 对 谈话 者 只 能 听 到 一 


门 特定 的 语言 。 这 是 CDMA 系 统 的 一 个 例子 ， 每 种 语言 代表 一 个 不 同 的 
代码 〈 见 图 1-10) 。 但 是 人 类 语言 并 不 是 完美 的 代码 。 此 外 ， 音 量 控制 
是 一 个 问题 ， 因 为 在 房间 里 的 每 个 人 都 可 以 听 到 其 他 所 有 谈话 ， 无 论 是 
用 什么 语言 。 我 们 需要 一 些 协调 ， 使 个 人 根据 彼此 之 间 的 距离 ， 调 整 自 


己 的 音量 


i 


和 i 


图 1-10 


而 


注 : 利用 CDMA 技 术 ， 每 个 代码 就 像 一 门 独 立 的 语言 。 在 鸡尾酒 会 的 比喻 中 ， 如 果 人 
们 使 用 不 同 语 言说 话 ， 多 个 谈话 就 可 以 在 一 个 房间 内 进行 。 然 后 ， 问 题 就 变 成 如 何 


种 


控制 音量 


控制 功率 电 平 


CDMA 也 有 自己 的 问题 。 我 们 现在 将 探讨 它 的 倡导 者 在 20 世 纪 90 年 
代 初 必须 克服 的 一 些 主 要 问题 


近 问 题 


不 同 信 号 在 同一 时 间 传输 ， 必 然 会 产生 干扰 (interference) 。 当 
你 考虑 到 和 基站 的 距离 时 ， 问 题 会 变 得 更 复杂 。 一 个 离 基站 一 英里 远 的 
人 打 电 话 ， 怎 么 能 不 被 一 个 距离 只 有 几米 远 的 人 干扰 ?这 个 人 所 在 的 位 
置 不 仅 信号 更 弱 ， 而 且 也 可 能 有 更 多 的 物体 (如 树木 ) 阻碍 信号 的 路 
径 。 这 就 导致 了 不 同 水 平 的 信道 质量 (channel quality) ， 如 图 1-11 
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图 1-11 
注 : 发 射 器 离 接收 器 越 远 ， 信 号 越 弱 ， 阻 挡 传 输 通 道 的 物体 也 可 能 越 多 。 在 图 中 ，A 
离 发 射 塔 距 离 近 且 没 有 被 阻挡 ， 而 B 离 发 射 塔 距离 远 且 受到 物体 阻挡 (例如 树木 ) 
我 们 在 这 里 所 描述 的 问题 称 为 远近 问题 (near-far problem) 。 
要 处 理 访 问题， 我 们 的 手机 需要 某 种 机 制 ， 以 便 它 可 以 调整 传输 能 
以 弥补 信道 质量 的 差异 ， 使 我 们 能 够 有 效 地 共享 空间 。 


为 了 缓解 该 问题 ， 最 初 提 出 的 解决 方案 是 传输 功率 控制 
(transmi-ssion power control， 简 称 TPC) 算法 。 该 算法 试图 平衡 
接收 到 的 信号 功率 。 基 站 会 测量 从 每 个 发 射 器 接收 的 数据 ， 将 其 与 所 需 
功率 进行 比较 ， 并 向 每 台 设 备 发 送 反馈 消息 ， 使 其 进行 相应 的 调整 。 


如 何在 接收 器 测量 功率 ? 功率 的 标准 单位 是 瓦特 (W) ， 表 示 每 秒 
发 射 的 能 量 数 。 所 以 ，5 W 意 味 着 每 秒 钟 传 输 的 能 量 为 5 个 单位 。 在 本 章 


中 ， 我 们 通常 讨论 的 功率 等 级 是 一 包 特 的 耕 干 部 分 ， 为 早已 (mW) ， 
即 千 分 之 一 瓦特 ， 或 微 瓦 (pW) ， 即 百 万 分 之 一 瓦特 。 


回 到 TPC 算 法 。 假 设 塔 上 所 需 的 功率 电 平 为 10 宣 瓦 。 如 网 1-12 上 所 
示 ， 手 机 A 和 手机 B 开 始 以 此 功率 发 送信 号 ， 基 站 接收 到 的 功率 分 别 为 5 
训 拟 和 1 毫 瓦 。 信 道 衰减 导致 A 的 功率 减 半 ，B 的 功率 减少 到 1/10。 为 了 
扭转 这 一 局 面 ，TPC 要 求 发 射 器 分别 以 目前 传输 功率 的 2 倍 和 10 倍 传输 
信号 。 这 意味 者 ，A 应 该 以 2x10 营 瓦 =20 坚 拟 的 功率 传输 ， 而 B 应 该 以 
10x10 毫 瓦 =100 毫 瓦 的 功率 传输 。 
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以 100 mW 的 功率 传输 
图 1-12 传输 功率 控制 算法 示例 
一 般 来 说 ，TPC 算 法 基于 以 下 方程 : 


下 次 功率 =“ 系 数 "x 当 前 功率 


其 中 “系数 ?等 于 所 需 功率 〈 示 例 中 为 10 宣 瓜 ) 除 以 所 接收 功率 〈5 
毫 瓦 和 1 毫 瓦 ) 。 


质量 不 只 是 功率 


有 了 TPC， 束 可 以 通过 增加 相应 传输 ， 来 平衡 接收 信号 功率 。 这 是 
个 足以 保证 <“ 民 好 的 接收 ? 呢 ? 不 一 定 。 接 收 到 的 信号 也 会 受到 来 目 其 他 
手机 的 干扰 。 你 可 以 在 图 1-13 中 看 到 演示 。 即 使 连接 A 的 发 射 功率 很 
高 ， 如 果 来 自 其 他 发 射 器 (链接 B〉 的 干扰 也 很 高 ， 那 么 A 接收 到 的 信 
号 质量 仍然 可 能 低 。 这 是 我 们 第 一 次 看 到 网 络 的 影响 ， 在 这 种 情况 下 ， 
受到 影响 的 是 使 用 相同 通信 介质 的 多 个 用 户 。 
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图 1-13 
注 : 理想 情况 下 ， 只 有 同一 个 发 射 器 发 出 的 信号 才 会 进入 其 接收 器 。 但 事实 并 非 如 


此 : 图 中 ， 一 些 A 的 传输 信号 将 被 一 同 带 入 B 的 接收 器 ， 有 反之 亦 然 


对 于 移动 通信 ， 我 们 需要 平衡 的 通常 是 质量 ， 而 不 是 功率 。 那 么 ， 
如 何 确定 接收 到 的 信号 质量 呢 ? 我 们 可 以 结合 三 个 因素 来 考虑 : 


1. 从 目标 发 射 器 接收 到 的 信号 功率 。 这 是 接收 器 试图 接收 的 发 
2. 从 非 目标 〈 即 和 干扰) 发 射 器 接收 的 信号 功率 。 这 些 是 接收 器 


希望 躲避 的 发 射 器 。 
3. 接收 器 噪声 ， 这 是 所 有 接收 器 固有 的 问题 。 


衡量 质量 可 以 用 积极 因素 (第 1 点 ) 除 以 消极 因素 (第 >、3 点 ) 。 
这 被 称 为 信号 干扰 比 (signal-to-interference ratio， 简 称 SIR) 。 


避免 < 军备 竞赛 * 


相 比 于 实现 目标 功率 ， 实 现 目 标 信号 干扰 比 更 复杂 ， 因 为 我 们 不 能 
仅 徘 增加 友 射 功率 来 同时 达到 所 需 的 信号 干扰 比 。 增 加 A 的 传输 功率 会 
增加 A 的 信号 干扰 比 ， 但 也 会 导致 其 他 连接 的 信号 干扰 比 减少 。 这 样 我 
们 束 必 须 增加 其 他 发 射 锅 的 功率 ， 以 提高 它们 的 信号 干扰 比 ， 不 过 这 将 
影响 到 其 他 所 有 人 ， 迫 使 他 们 增加 发 射 功率 。 以 此 类 推 ， 其 结果 必然 是 
一 场 “ 军 备 况 赛 "， 最 终 ， 以 最 高 功率 传输 的 一 方 将 获胜 。 但 这 不 是 一 种 
非常 有 效 的 分 有 方式 。 


如 果 每 台 移 动 设备 都 确定 一 个 理想 的 信号 干扰 比 ， 古 否 有 可 能 找到 
一 组 传输 功率 ， 能 同时 达到 所 有 的 目标 ? 答案 是 肯定 的 ， 只 要 理想 的 信 
号 干扰 比 是 可 行 的 (feasible) ， 或 彼此 兼容 的 。 换 句 话 说， 不 能 所 有 
人 都 希望 实现 高 得 不 切实 际 的 信号 干扰 比 。 


该 解决 方案 被 称 为 分 布 式 功率 控制 (distributed power 


control) ， 简 称 DPC。 它 的 工作 原理 是 : 


1. 每 台 设 备 最 初 具有 一 定 的 初始 传输 功率 。 
2， 接 收 器 测量 每 台 发 射 器 的 信号 干扰 比 。 
3， 基 于 目标 和 测量 信号 干扰 比 的 比值 ， 每 台 发 射 器 调整 其 功率 


4 根据 需 要 重复 步骤 2 和 3。 


不 同 于 之 前 讨论 的 、 单 一 步骤 的 远近 传输 功率 控制 算法 ， 分 布 式 功 
率 控制 是 一 种 迭代 (iterative) 算法 ， 它 是 不 断 反复 的 。 鉴 于 目标 信号 
干扰 比 是 可 行 的 ， 事 实证 明 ， 分 布 式 功率 控制 算法 会 收敛 
(converge) ， 这 意味 着， 信号 干扰 比 对 应 的 功率 电 平 将 停止 更 新 。 
事实 上 ， 这 些 收 敛 的 功率 电 平 也 将 是 最 佳 (optimal) 的 ， 因 为 它们 将 
使 用 最 少 的 能 量 。 


分 布 式 功率 控制 工作 原理 


如 图 1-14 所 示 ， 假 设 在 一 个 单元 里 有 三 台 移 动 站 A、B 和 C。 图 中 
实 线 表示 每 对 发 射 器 和 接收 器 上 行 连接 的 直接 信道 增益 (channel 
gains) 。 信 道 增益 衡量 功率 放大 (amplified) 多 少 ， 或 者 出 于 实际 
目的 ， 表 示 从 信和 号 源 到 目的 地 功率 增强 了 多 少 〈 由 于 它们 是 分 数 ， 因 此 
所 谓 增强 其 实 是 衰减 ) 。 直 接 信道 增益 应 该 尽 可 能 高 ， 因 为 它 代 表 了 预 
期 的 通话 。 与 此 相反 ， 虚 线 代 表 干 扰 信道 增益 ， 也 就 是 由 于 某 些 因素 ， 
非 预期 信号 将 耦合 到 各 个 接收 器 。 你 可 以 在 表 1-1 和 表 1-2 中 看 到 信道 增 
益 、 目 标 信号 干扰 比 和 接收 器 噪声 示例 (图 中 数字 是 为 了 进行 说 明 ， 并 
不 代表 通常 在 蜂 窜 网络 中 观察 到 的 实际 数字 )。 
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图 1-14 三 台 移 动 站 与 基站 之 间 的 信道 
注 : 实 线 表 示 直 接 信道 增益 ， 而 虚线 表示 干扰 信道 增益 
表 1-1 分 布 式 功率 控制 示例 的 信道 增益 
发 射 器 接收 器 
A B 
A 0.9 0.1 
0.1 0.8 
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表 1-2 分 布 式 功率 控制 示例 的 所 需 信 号 干扰 比 和 噪声 参数 


链接 目标 信号 干扰 比 噪声 ( 毫 瓦 ) 
A 1.8 0.1 
B 2.0 0.2 
C 2 0.3 


让 我 们 举例 说 明 分 布 式 功率 控制 算法 的 前 几 步 计算 。 为 了 更 新 发 送 
功率 ， 分 布 式 功率 控制 算法 采用 了 一 个 类 似 于 之 前 传输 功率 控制 算法 方 
程 的 直观 方程 ， 但 它 只 涉及 信号 干扰 比 而 不 是 信道 质量 。 对 于 每 一 台 发 
射 器 而 言 ， 其 更 新 率 为 ; 


下 次 功率 =" 系 数 "x 当 前 功率 
其 中 “系数 ”为 目标 信号 干扰 比 除 以 测量 信号 干扰 比 的 比值 。 


这 个 更 新 是 相当 合乎 逻辑 的 。 如 果 测 得 的 信号 干扰 比 低 于 所 需 信和 号 
干扰 比 ， 那 么 “系数 ?将 大 于 1。 为 了 平衡 它们 ， 传 输 功 率 将 增加 。 相 
反 ， 如 采 测 得 的 信号 干扰 比 高 于 所 需 , “系数 ”将 低 于 1， 传 输 功 率 将 降 
低 。 发 射 器 便 可 以 使 用 更 少 的 能 量 ， 同 时 此 举 将 有 助 于 改善 其 他 发 射 需 
的 信号 干扰 比 。 最 后 ， 如 果 训 得 的 信号 干扰 比 和 所 需 的 一 样 , “系数 ?将 
古 1， 发 送 功率 将 保持 不 变 。 如 果 目 标 已 经 实现 ， 则 没有 必要 做 出 改 


为 什么 这 样 的 更 新 是 有 必要 的 ? 在 一 个 单元 中 ， 每 台 设 备 对 其 他 设 
备 施加 负 外 部 性 (negative ”externality) ， 对 其 进行 干扰 。 换 句 话 
说 ， 在 实现 自身 目标 的 同时 ， 每 台 设 备 还 会 对 网 络 的 其 余部 分 造成 一 
些 “ 损 害 ”。 此 更 新 对 设备 保持 控制 :每 当 信 号 干扰 比 高 于 所 需 水 平 ， 功 
率 电 平 便 会 下 降 ;， 当 信 号 干扰 比 太 低 时 ， 功 率 电 平 便 会 提高 。 


基站 和 设备 之 间 进 行 “ 信 息 传 递 ”， 以 纠正 这 种 偏差 的 过 程 ， 是 一 个 
负 反 馈 (negative feedback) 的 例子 ( 见 图 1-15，。 它 迫使 及 射 器 
内 化 其 负 外 部 性 ( 即 为 其 造成 的 干扰 付出 代价 ) ， 按 照 规则 弥补 对 系统 
造成 的 附加 干扰 。 


我 们 在 本 书 中 讨论 不 同 网 络 时 ， 负 反馈 和 人 负 外 部 性 的 概念 会 反复 出 
现 。 更 普遍 的 是 ， 负 反馈 是 一 种 在 系统 中 保持 平衡 (equilibrium) 的 
方式 ， 它 会 对 输出 过 程 中 的 波动 进行 检查 和 平衡 。 使 系统 偏离 平衡 的 正 
反馈 也 会 在 后 面 提 到 。 


“这 是 你 的 SIR” 
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“这 是 你 的 SIR” ] 
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图 1-15 
注 : 信号 塔 告诉 每 台 设备 其 当前 接收 到 的 信号 干扰 比 ， 它 将 充当 负 反 馈 信 号 。 利 用 
该 信号 ， 每 台 设 备 可 以 独立 更 新 其 传输 功率 

回 到 我 们 的 例子 。 在 分 布 式 功率 控制 方程 所 需 的 所 有 数量 中 ， 我 们 
知道 所 需 的 信号 干扰 比值 〈 表 1-2) ， 当 前 的 发 射 功率 可 以 设 为 2 毫 瓦 ， 
那 就 只 剩 下 测量 信号 干扰 比 了 。 对 于 每 个 链接 ， 我 们 可 以 这 样 计算 : 


1 
Na TT wy Assay = 一 
Wa Po og Par ra Na 


测量 信号 干扰 比 = 


口 
干扰 + 噪声 


我 们 如 何 得 到 “信号 ”、“ 干 扰 * 和 “噪声 ”的 数值 ? 从 链接 A 开始 : 


信号 : 从 发 射 器 A 到 接收 器 A 的 直接 增益 ， 乘 以 发 射 功 率 。 在 
表 1-1 中 ， 它 是 0.9X2 毫 瓦 = 1.8 毫 瓦 。 

干扰 : 从 其 他 发 射 器 到 接收 器 A 的 间接 增益 的 总 和 ， 乘 以 它 
们 的 传输 功率 。 在 表 1 -1 中 ， 我 们 看 第 一 列 : 从 B 到 A， 增 益 为 0. 1， 
从 C 到 A 是 0.2。 因 此 干扰 值 为 0.1X2 毫 瓦 + 0.2X2 毫 瓦 = 0.6 毫 瓦 。 


骂 声 : 这 是 接收 器 噪声 ， 如 表 1 - 2 所 示 ， 链 接 A 的 噪声 为 0.1 


在 现实 中 ， 接 收费 甚至 不 需要 做 乘法 和 加 法 计算 ， 因 为 它 可 以 实际 
测量 信号 干扰 比 。 


因此 ， 链 接 A 的 测量 信号 干扰 比 为 : 


1.8 1.8 
0.6+01 07 1 


链接 B 怎 么 样 呢 ? 从 发 射 髓 B 到 接收 右 B， 直 接 增益 为 0.8 野 拟 ， 所 
以 信号 功率 为 0.8x2 毫 瓦 =1.6 毫 瓦 。 间 接 增益 来 自发 射 器 A 和 C: 从 A 到 
B， 增 益 为 0.1， 从 C 到 B 也 是 0.1。 这 意味 着 干扰 功率 为 0.1x2 室 瓦 +0.1x2 
晤 凡 = 0.4 量 拟 。 最 后 ， 链 接 B 的 接收 井 噪 声 为 0.2 坚 拟 。 因 此 ， 链 接 B 的 
测量 信号 干扰 比 是 1.6/ 0.6 = 2.67。 


使 用 相同 步 又， 可 以 得 出 链接 C 的 信号 干扰 比 为 : 
0.9x 2 二 
02x2+02x2+03 11 


让 我 们 把 这 些 值 和 所 需 信 号 干扰 比 进行 比较 。 对 于 链接 A， 所 需 的 


值 为 1.8， 所 以 测量 信号 干扰 比 偏 高 ， 高 出 2.57-1.8 = 0.77。 同 样 ， 链 接 
B 的 测量 信号 干扰 比 偏 高 ， 高 出 2.67-2.0 = 0.67， 而 链接 C 的 测量 信号 干 
扰 比 偏 低 ， 低 了 2.2-1.64 = 0.56。 


我 们 现在 可 以 使 用 DPC 方程 计算 新 的 功率 电 平 。 系 数 是 多 少 ? 我 们 
用 每 个 链接 的 目标 信号 干扰 比 除 以 测量 信号 干扰 比 : 1.8 / 2.57 = 0.70， 
2.0 / 2.67 = 0.75， 以 及 2.2 / 1.64 = 1.34。 正 如 预期 的 那样 ， 链 接 A 和 B 的 
比值 小 于 1 (测量 值 太 高 ) ， 链 接 C 的 大 于 1 (测量 值 太 低 ) 。 有 了 这 些 
值 ，A、B 和 C 的 下 一 个 功率 电 平 分 别 为 : 


0.70 X 2 之 瓦 = 1.40 写 瓦 
0.75 X 2 党 拟 = 1.50 宫 瓦 
1.34 X 2 之 瓦 = 2. 68 写 瓦 


负 反 馈 导 致 A 和 B 的 功率 电 平 降低 ，C 的 增加 ， 正 如 我 们 预期 的 那 
样 。 


下 一 步 是 什么 ? 用 本 书 的 方程 来 计算 这 些 新 功率 电 平 的 信号 干扰 
比 。 之 后 呢 ? 基于 更 新 方程 ， 调 整 功率 电 平 。 后 面 步 又 的 计算 以 同样 的 
方式 进行 。 如 果 你 想 看 到 更 多 计算 过 程 ， 请 参考 本 书 网 站 Q1.4 部 分 。 


DPC 算 法 的 30 次 迭代 的 传输 功率 和 信号 干扰 比 水 平 都 标注 在 图 1-16 
中 。 大 约 10 次 迭代 后 ， 我 们 不 再 能 看 到 两 者 数量 有 明显 的 变化 ， 这 表明 
DPC 算 法 已 收敛 到 平衡 。 测 量 信和 号 干扰 比 已 经 达到 目标 值 1.8、2.0 和 
2.2， 功 率 电 平分 别 为 1.26、1.31 和 1.99 毫 瓦 。 


为 什么 链接 C 的 功率 电 平 比 其 他 两 者 高 得 多 ? 它 具 有 所 有 接收 器 中 
最 高 的 噪声 成 分 (0.3 毫 瓦 )》 ， 从 其 他 链接 获得 的 最 高 干扰 增益 〈 两 者 
均 为 02) ， 以 及 所 有 链接 中 最 高 的 目标 信号 干扰 比值 (2.2) 。 它 需要 
更 高 的 传输 功率 来 克服 这 些 缺点 。 


为 什么 算法 会 收敛 ? 由 于 测量 信号 干扰 比 和 目标 信号 干扰 比 相 等 ， 
更 新 方程 中 的 “系数 ”将 成 为 1， 所 以 功率 不 会 再 改变 。 负 反馈 使 网 络 取 
得 平衡 ， 使 设备 进行 有 效 共享 。 它 将 保持 这 种 状态 ， 直 到 网 络 改变 ， 比 
如 当 设 备 的 干扰 条 件 改变 ， 一 合 新 设备 进入 单元 ， 或 现 有 设备 离开 单 
风 。 


发 射 功率 


SIR 


0 5 10 lS 20 25 30 


图 1-16 
注 : 图 为 算法 30 次 迭代 的 发 射 功率 (上 图 ) 和 信号 干扰 比 (SIR) 水 平 〈 下 图 ) 


在 一 个 真正 的 单元 里 ， 可 能 有 上 百 台 电话 ， 随 着 通话 开始 和 结束 ， 
以 及 人 们 从 一 个 位 置 移动 到 男 一 个 位 置 ， 可 以 想象 从 链接 到 链接 的 信道 
条 件 和 信号 干扰 比值 会 迅速 改变 。 其 结果 是 ， 需 要 实现 高 达 每 秒 1 500 
次 的 功率 控制 。DPC 算 法 的 一 个 好 处 是 ， 每 台 设 备 不 需要 了 解 其 他 链接 
如 何 运 行 。 要 计算 下 一 个 功率 电 平 ， 所 需要 的 只 是 它 的 当前 传输 功率 、 
目标 信号 干扰 比 和 当前 测量 信号 干扰 比 。 这 些 都 是 其 自身 的 参数 ， 并 且 
它 会 独立 做 出 目前 的 决定 〈 例 如 ， 设 备 不 需要 知道 任何 其 他 链接 的 信和 号 
干扰 比 ) 。 这 人 允许 每 台 设 备 在 内 部 执行 计算 ， 而 不 需要 与 其 他 设备 共享 
音 息 。 换 句 话说，DPC 是 一 个 完全 分 布 式 (distributed) 的 算法 〈 见 
图 1-17) ， 而 不 是 我 们 后 面 会 见 到 的 更 为 集中 式 (centralized) 的 算 
法 《如 第 5 章 谷歌 的 网 页 级 别 ) 。 
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更 新 :“ 系 数 ”x 当前 功率 
图 1-17 
注 : 分 布 式 功率 控制 是 一 种 完全 分 布 式 算法 


CDMA 标 准 


提出 DPC 算 法 ， 是 为 了 处 理 CDMA 干 扰 问 题 。 即 使 有 了 这 样 的 发 
展 ， 也 是 在 现实 的 网 络 条 件 下 ， 经 过 数 次 全 美 范围 的 大 规模 试验 演示 
后 ， 它 才 得 到 了 各 大 网 络 运 营 商 的 文 持 。 


最 终 ，CDMA 于 1993 年 被 批准 为 IS-95 标 准 下 的 2G 蜂 窜 标 准 ， 其 品 
有 牌 为 cdmaOne。 三 年 后 ，CDMA 在 美国 的 第 一 次 大 规模 的 两 业 部 署 由 
Sprint PCS 完 成 。 虽 然 IS-95 已 经 基本 升级 为 3G 标 准 ， 但 该 标准 及 其 直接 
修改 版 本 仍然 只 在 世界 部 分 地 区 使 用 。 


问 上 升 ， 回 前 进 : 3G、4G 及 其 他 


几 十 年 来 ， 移 动 入 网 数量 剧 增 。 仪 美国 ， 移 动 入 网 数量 就 从 1985 年 
的 大 约 340 000 增 长 到 2015 年 的 327 000 000，30 年 中 增长 了 近 1 000 倍 。 
目 2011 年 以 来 ， 美 国 的 移动 电话 渗透 率 已 经 超过 了 100%。 


进入 21 世 纪 ，3G 手 机 在 全 世界 迅速 普及 。 国 际 电信 联盟 (ITU) 于 
2000 年 发 布 3G 技 术 规 范 ， 本 质 上 就 是 要 求 手 机 像 掌上 电脑 一 样 工作 : 
除了 打 电 话 和 发 短信 ， 手 机 还 具备 上 网 、 视 频 通话 、 移 动 电视 的 功能 。 
目前 两 大 主要 的 3G 标 准 分 别 是 用 在 欧洲 、 日 本 和 中 国 的 UMTS (通用 移 
动 通信 系统 ) ， 以 及 用 于 美国 和 韩国 的 CDMA2000【〔 码 分 多 址 )。 这 两 
种 技术 都 基于 CDMA， 通 常 被 部 区 在 1.9~2.1 GHz 的 频率 范围 内 。 


截至 2015 年 年 初 ， 世 界 上 大 约 70% 的 人 口 被 至 少 一 个 3G 网 络 履 盖 。 
这 一 数字 在 2012 年 年 初 是 50%。 据 预测 ， 到 2020 年 ， 世 界 上 超过 4/5《〈 即 
80% 以 上 ) 的 人 口 将 可 以 使 用 3G 网 络 ， 这 将 使 其 几乎 无 处 不 在 。 有 关 智 
能 手机 如 何 出 现 的 信息 ， 请 参考 本 书 网 站 Q1.5 部 分 。 


目 从 1G 网 络 在 20 世 纪 80 年 代 实 现 商 业 化 以 来 ， 大 约 每 10 年 就 有 新 
一 代 的 蜂窝 网 络 出 现 。 按 照 这 一 速度 ，4G 网 络 性 能 要 求 在 2008 年 被 提 
出 ， 与 之 前 的 3G 规 范 相 比 ， 它 提出 更 高 的 速度 和 能 力 要 求 。 此 后 出 现 


的 主要 标准 是 长 期 演进 (long-term _ evolution) ， 简 称 LTE。LTE 没 有 使 
用 CDMA 技 术 ， 而 是 基于 正 交 频 分 复 用 (orthogonal frequency 
division multiplexing) 技术 ， 简 称 OFDM。 


在 美国 ， 第 一 台 LTE 智 能 手机 出 现在 2011 年 年 底 。2015 年 年 初 ， 世 
界 上 大 约 25% 的 地 区 歼 盖 了 4G 网 络 ， 并 且 预 计 到 2020 年 ，4G 网 络 履 盖 
率 将 增加 到 60% 以 上 。2017 年 ，4G 相 对 于 3G 的 性 能 改进 有 望 吸 引 10 亿 
用 户 。 虽 然 截 至 2016 年 ，4G 网 络 履 盖 范 围 小 于 3G 网 络 ， 但 它 正 以 更 快 
的 步伐 部 署 着 。 


蜂 离 网 络 的 发 展 历程 ， 完 美 诠释 了 多 年 来 网 络 如 何 尽 力 满 足 消 费 者 
对 性 能 的 需求 这 一 问题 。 不 同 的 共享 方 法 ， 无 论 是 频率 、 时 间 还 是 基于 
代码 的 无 线 网 ， 都 被 开发 出 来 以 实现 这 个 目标 。 虽 然 我 们 并 不 知道 这 其 
中 涉及 的 过 程 ， 但 对 于 蜂 祸 网 络 的 运行 而 言 ， 实 时 更 新 和 管理 我 们 通话 
的 功率 是 必 不 可 少 的 。 找 到 正确 的 共 至 方法 很 困难 ， 但 也 非常 重要 。 


分 布 式 功率 控制 说 明了 几 个 在 网 络 发 展 和 本 书 中 经 常 出 现 的 主题 : 
负 有 反馈 、 系 统 平衡 ， 以 及 分 布 式 协调 。 它 也 说 明了 我 们 将 反复 看 到 的 以 
下 主要 观点 允许 每 个 用 户 出 于 目 映 利益 做 出 独立 的 决定 ， 可 以 在 所 有 
用 户 间 宗 积 到 一 种 公平 而 有 效 的 状态 。 


在 下 一 章 ， 我 们 将 转向 Wi-Fi， 这 和 是 另 一 种 类 型 的 无 线 网 络 。 随 之 
而 来 的 是 和 蜂 久 不 同 的 共享 模式 : 不 同 于 运用 严格 的 功率 控制 算法 ， 
Wi-EFi 依 靠 随机 访问 管理 在 同一 地 点 的 用 户 之 间 的 干扰 。 


1. 1 英里 wx1.609 千 米 。 一 一 编者 注 
2. 于 兆赫 也 称 “ 吉 赫 ”。 编者 注 


第 2 章 
“随意 地 ”访问 网 络 


到 20 世 纪 90 年 代 中 期 ， 第 二 代 蜂 帘 网 络 已 经 在 全 世界 普及 。 两 种 相 
互 竞争 的 技术 一 ”TDMA 和 CDMA， 都 急需 网 络 容 量 有 所 改进 。 


大 约 在 这 个 时 候 ， 工 程 师 们 开始 思考 ， 是 否 能 找到 一 个 完全 不 同 的 
方法 来 共享 空间 。 他 们 在 这 个 方 辐 上 的 努力 带 来 了 Wi-Fi 技 术 的 发 明 。 


交通 信号 灯 与 停车 标志 


首先 ， 让 我 们 做 一 个 天 于 汽车 交通 的 简单 比喻 ， 说 明 共 至 Wi-Fi 如 
何不 同 于 共 至 蜂 祸 网络 。 


假设 你 正在 开车 ， 开 到 一 个 十 字 路 口 ， 如 图 2-1 所 示 。 如 果 十 字 路 
口 由 交通 信号 灯 控 制 ， 那 么 当 绿 灯亮 起 时 ， 十 字 路 口 则 专门 对 你 所 在 的 
一 侧 开 放 。 这 类 似 于 将 时 间 、 频 率 或 代码 分 配给 通话 者 ， 回 其 开放 在 蜂 
富 网 络 中 的 通话 时 间 。 


图 2-1 


注 : 蜂窝 和 Wi -Fi 共享 资源 的 主要 区 别 类 似 交通 信号 灯 和 停车 标志 之 间 的 差异 。 当 
流量 很 小 时 ， 停 车 标志 (Wi -Fi) 更 有 效 ， 但 当 汽车 数量 〈 设 备 ) 增加 时 ， 它 们 是 
不 可 扩展 的 。 在 这 些 情况 下 ， 我 们 倾向 于 使 用 交通 信号 灯 〈 蜂 窜 ) ， 每 次 只 向 一 侧 
开放 路 口 《资源 ) ， 以 调节 交通 流量 

只 要 马路 另 一 侧 有 和 车辆， 红 灯 就 有 意义 。 但 要 是 你 被 挡 在 红 灯 前 ， 
为 一 侧 却 没有 来 往 车 辆 呢 ? 这 似乎 相当 浪费 (而 且 十 分 令 人 泪 形 ) 。 你 
为 什么 不 能 开车 通过 呢 ? 在 这 种 情况 下 ， 集 车 标志 会 是 一 种 调节 交通 的 
更 有 效 的 方式 。 当 我 们 接近 停车 标志 时 ， 停 下 来 看 看 两 人 出， 如 果 没 有 人 
台 继 续 前 行 。 我 们 只 需要 一 种 协调 方式 〈 停 下 来 看 看 ) ， 来 尽量 减少 发 
生意 外 的 概率 。 


有 了 停车 标志 后 ， 惑 不 会 再 让 茶 些 车 辆 享用 专用 路 口 ， 而 是 只 要 大 
家 齐 循 随机 访问 的 规则 ， 就 可 以 共享 路 口 。 当 交通 流量 小 而 可 变 时 ， 这 
种 方法 更 加 有 效 。 仿 车 标志 类 似 于 Wi-Fi 的 工作 方式 : 没有 专门 的 资 


源 ， 而 是 让 设备 在 传输 前 先 “ 听 ”( 即 “两 边 看 ”>) ， 以 防止 它 与 其 他 设备 
发 生 碰撞 。 


但 随 着 交通 量 的 增加 ， 俘 车 标志 就 成 为 问题 。 当 连接 线路 建立 起 来 
时 ， 和 车辆 依次 “ 停 ? 和 *“ 走 ”的 性 质 会 导致 非常 长 的 等 竺 时间 ， 特 别 是 当 刀 
一 侧 没 有 停车 标志 时 。 在 这 种 情况 下 ， 交 通信 号 灯 的 专用 性 质 可 能 成 为 
首选 。 正 如 我 们 将 看 到 的 ，Wi-Fi 也 有 类 似 的 问题 ， 随 着 设备 数量 增 
加 ， 其 性 能 会 大 幅 下 降 。 


Wi-Fi 的 产生 和 演化 


如 琳 我 们 可 以 建立 小 型 站 点 ， 为 劳 边 移动 不 快 的 人 提供 无 线 互 联网 
连接 呢 ? 这 种 观点 构成 了 Wi-EFi 的 基础 ， 如 图 2-2 所 示 。 它 利用 了 随机 访 
问 提供 的 优势 。 


图 2-2 
注 : Wi -Fi 为 接近 接 入 点 的 设备 (如 笔记 本 电脑 、 手 机 和 平板 电脑 ) 提供 无 线 连 接 


1985 年 ， 美 国联 邦 通 信和 委员 会 同 公众 开放 了 一 些 频段 。 不 同 于 通信 


公司 必须 购买 昂 贯 的 许可 证 来 经 营 的 蜂 视频 段 ， 任 何人 都 可 以 使 用 这 些 
频段 〈 只 要 他 们 遵循 某 些 规则 ) 。 这 些 频段 频率 约 为 2.4GHz 和 5.8 
GHz， 被 称 为 工业 、 科 学 和 医疗 频段 〈 简 称 ISM) 。 工 程 师 们 抓 住 机 
会 ， 使 用 ISM 频 段 发 展 通 信 以 及 后 来 的 Wi-Fi。 他 们 也 将 其 用 于 其 他 目 
的 。 事 实 上 ， 如 今 最 常见 的 ISM 设 备 是 微波 炉 ， 因 为 这 些 频 率 刚 好 能 很 
好 地 激发 水 分 子 。 


由 于 美国 电气 及 电子 工程 师 学 会 (IEEE) 想 以 其 标准 的 方案 来 命 
名 ， 所 以 Wi-EFi 的 官方 名 称 被 定 为 IEEE 802.11。“802” 针 对 局 域 网 ， 表 
示 它 是 短 距 离 的 ，“.11” 表 示 无 线 局 域 网 。 更 为 吸引 人 的 名 字 Wi-Fi， 
是 “无 线 保 真 ”(wireless ”fidelity〉 的 简称 ， 它 从 被 发 明 后 一 直 沿 用 至 


今 。 


由 于 不 同 机 构 都 在 发 展 Wi-Fi 技 术 ， 在 声称 使 用 Wi-Fi 的 产品 之 间 ， 
需要 一 个 方法 来 确保 其 互 操 作 性 。 出 于 这 一 目的 ，Wi-Fi 联 盟 于 1999 年 
成 立 ， 在 符合 IEEE 802.11 标 准 的 设备 上 张贴 Wi-Fi 标 识 。 


一 碗 字母 汤 


像 蜂 鲍 拉 术 一 样 ，Wi-Fi 在 短 时 间 内 得 到 显著 改进 。 各 种 升级 大 大 
提升 了 用 户 的 连接 速度 。 如 何 测量 速度 ?以 每 秒 的 比特 数 (bps) 为 单 
位 。 今 天 ， 无 线 上 网 速度 一 般 计 为 数 百 万 bps， 即 Mbps。 


第 一 套 Wi-Fi 标 准 于 1997 年 颁布 ， 提 供 2 Mbps 的 速度 ， 在 2.4 GHz 的 
频率 范围 运行 。 使 命名 规则 更 加 混乱 的 是 ， 每 次 Wi-Fi 标 准 升 级 都 在 
802.11 后 增加 一 个 字母 ， 但 并 未 按时 间 顺 序 进行 : 


。 1999 年 ，802. 11b 标 准 颁布 ， 使 用 2.4 GHz 频段 ， 最 高 传输 速 
度 为 11 Mbps。 同 年 ，802. 11a 标 准 颁布 ， 可 以 在 5 GHz 频段 中 达到 54 
Mbps 的 传输 速度 。 


。 2003 年 ，802. 11g 标 准将 2.4 GHz 频段 的 最 高 速度 提高 到 54 
Mbps 。 

。 2009 年 ，802. 11n 标 准将 最 高 传输 速度 提高 到 超过 100 
Mbps， 可 以 在 2.4 GHz 和 5 GHz 频段 运行 。 

。 最 近 ，802. 11ac 标 准 于 2013 年 发 布 ， 预 计 能 在 5 GHz 频段 达 
到 超过 1 Gbps (1 000 Mbps) 的 峰值 速度 。 


你 可 以 在 表 2-1 中 看 到 此 进展 的 概要 。 不 过 ， 最 大 额定 速度 只 能 在 
论 上 达到 。 在 现实 条 件 下 ， 能 超过 宣传 中 的 理想 速度 的 一 小 部 分 就 很 
直 运 J， 
表 2-1 随 着 时 间 推 移 ，Wi-Fi 标 准 的 发 展 及 其 部 分 特征 


标准 年 份 频率 (GHz) 最 高 额定 速度 (Mbps) 
1997 2.4 之 
b 1999 2.4 11 
a 1999 5 54 
g 2003 2.4 54 
n 2009 2.4&5 450 
ac 2013 2.4& 5 1 300 


注 : 表 中 还 有 其 他 的 变化 版 本 没有 列 出 


随 着 传输 速度 提高 ， 人 们 对 Wi-Fi 服 务 的 需求 持续 增加 。 和 截至 2011 
人 全， 全 世界 已 经 有 超过 10 亿 人 台 无 线 设 备 被 使 用 ， 并 且 每 年 会 增加 数 亿 
台 。 到 2014 年 ， 这 个 数字 已 经 达到 40 亿 ， 预 计 到 2016 年 年 底 ， 它 将 达到 
70 亿 。 


Wi-Ei 如 何 部 署 


如 前 所 述 ，Wi-Fi* 共 至 空间 ”的 方法 和 蜂 氏 技术 的 完全 不 同 ， 但 实 
际 上 它们 的 部 著 方 式 非 党 相似 。 


Wi -Fi 网 络 中 的 用 户 位 于 一 个 基本 服务 集 (basic service 
set) ， 简 称 BSS (或 扩展 服务 集 extended service set) ， 而 不 是 
单元 内 。 
。 在 每 个 服务 集中 ， 用 户 直接 通过 接 入 点 (access point， 简 
称 AP) 通信 ， 而 不 是 基站 。 


你 可 以 在 图 2-3 中 看 到 Wi-Fi 的 网 络 布局 。 当 设备 搜索 Wi-Fi 连 接 
时 ， 它 会 发 送 消 四 ， 发 现 传输 范围 内 的 接 入 点 。 之 后 ， 你 可 以 在 屏幕 上 
看 到 供 选 择 的 网 络 名 称 列 表 。 每 一 个 容易 识别 的 名 称 都 代表 一 个 服务 
集 ， 通 常 被 称 为 服务 集 标识 符 (service set “identifiers) ， 人 简称 
SSID。 也 许 你 兽 经 一 次 次 失望 地 看 到 ， 一 个 共有 良好 信和 号 强度 的 SSID 
芳 有 一 把 锁 : 如 果 网 络 受 到 密码 保护 ， 你 必须 使 用 密码 验证 身份 ， 设 备 
才 可 以 访问 接 入 点 。 


互联 网 


访问 回程 


基本 服务 集 基本 服务 集 基本 服务 集 
图 2-3 一 个 典型 的 无 线 网 络 部 署 示意 图 


每 个 接 入 后 通常 会 连接 到 回程 (backhaul) 。 回 程 是 有 线 网 部 
团 ， 通 常 为 以 太 网 (Ethernet) ， 这 是 另 一 个 〈 也 老 得 多 的 ) IEEE 
802“ 家 族 成 员 ”。 由 此 ， 以 太 网 连接 到 接 入 网 络 ， 并 最 终 提 供 Wi-Fi 部 嗜 
与 互联 网 其 余部 分 之 间 的 连接 。 


为 了 通过 Wi-Fi 网 络 发 送 和 接收 ， 设 备 需要 做 到 以 下 几 点 。 它 需要 
选择 在 其 范围 内 的 接 入 点 ， 并 选择 使 用 正确 的 频道 。 当 设备 连接 时 ， 也 
需要 在 设置 其 传输 速度 时 监听 接 入 点 ， 正 因 如 此 ， 传 输 速度 可 能 根据 信 
道 条 件 产生 很 大 变化 。 


如 果 你 对 这 些 过 程 的 更 多 信息 感 兴趣 ， 请 参考 本 书 网 站 的 
Q2.1~Q2.3 部 分 。 在 那里 ， 你 也 可 以 找到 Wi-Fi 网 络 部 署 的 更 多 细节 
(Q2.4~Q2.6) 。 在 本 章 的 其 余部 分 ， 我 们 将 讨论 在 设备 做 到 其 他 事情 


后 要 完成 的 剩余 任务 之 一 : 管理 干扰 。 这 是 共享 的 一 个 重要 部 分 ， 
Fi 的 方法 和 蜂窝 拉 术 完全 不 同 。 


随机 访问 的 方法 


当 两 人 台 发 射 器 处 于 彼此 干扰 的 范围 内 ， 又 在 相近 的 时 间 发 送信 号 ， 
它们 的 信号 就 会 碰撞 。 更 确切 地 说 ， 我 们 所 说 的 是 帧 磁 撞 ， 其 中 一 帧 是 
一 个 数字 数据 传输 《更 多 信息 见 第 11 章 ) 。 


帧 碰撞 有 三 种 可 能 的 结果 。 第 一 种 是 最 坏 的 情况 ， 两 者 都 丢失 。 这 
意味 着 每 个 帧 的 接收 器 不 能 正确 地 解码 。 第 二 种 是 捕捉 (capture) ， 
这 意味 着 两 者 中 更 强 的 那个 被 接收 《〈 见 图 2-4) 。“ 强 ”在 这 里 指 的 是 信 
号 干扰 比 ， 是 我 们 在 第 1 章 谈 到 的 信号 质量 衡量 标准 。 第 三 种 是 双重 捕 
获 (double capture) ， 这 是 最 好 的 情况 : 两 者 都 被 恰当 地 接收 。 
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图 2-4 
注 : 当 两 个 Wi -Fi 移动 站 彼此 接近 ， 并 大 约 在 同一 时 间 发 送 一 个 帧 时 ， 帧 将 会 碰 
撞 。 由 于 A 比 B 具 有 较 高 的 信号 干扰 比 ，A 仍 然 有 更 大 的 机 会 被 接收 
那么 ， 哪 一 个 结果 会 上 右上 风 呢 ?这 在 很 大 程度 上 取决 于 几 个 因素 。 
我 们 采取 保守 的 方法 ， 假 设 最 坏 的 情况 : 每 次 发 生 人 页 撞 ， 这 两 帧 总 是 会 
丢失 。 


我 们 在 第 1 半 中 看 到 3G 蜂 富 如 何 管理 干扰 给 每 个 信号 不 同 的 代 
码 ， 并 使 用 功率 控制 调整 其 强度 。 也 许 我 们 也 可 以 在 这 里 使 用 这 种 方 
法 ? 不 完全 如 此 。Wi-Fi 具 有 一 些 性 质 ， 它 们 使 功率 控制 无 法 成 为 一 种 
有 效 的 解决 方 采 。 


首先 ，Wi-Fi 频 段 没 有 经 过 许可 :由 于 Wi-Fi 频 谱 可 供 任何 人 免费 使 
用 ， 因 此 有 更 多 的 干扰 会 超出 我 们 的 控制 。 另 外 ， 其 单元 规模 小 得 多 : 
在 干扰 条 件 下 ， 将 男 一 个 人 添加 进 服务 集会 造成 很 大 影响 ， 因 为 一 开始 
只 有 少数 几 个 人 。 此 外 ， 它 的 最 大 传输 功率 较 小 : 由 于 ISM 频 段 没 有 经 
过 许可 ， 我 们 不 能 把 功率 调 得 太 高 。 


如 果 不 能 使 用 功率 控制 ， 那 么 我 们 如 何 处 理 干扰 呢 ? Wi-Fi 和 采用 了 
一 种 完全 不 同 的 方法 : 一 开始 就 试图 避免 介 撞 发 生 。 


协调 是 关键 


想 想 TDMA (第 1 章 ) ， 其 中 每 个 链接 都 有 自己 的 传输 时 段 。 如 果 
有 三 台 发 射 器 A、B 和 C， 传 输 顺 序 大 概 会 是 A、B、C、A、B、C 等 。 我 
们 保证 每 个 用 户 每 轮 都 有 使 用 传输 媒介 的 时 段 。 在 车 辆 交通 的 比喻 中 ， 
这 就 像 交 通信 号 灯 控 制 的 十 字 路 口 ， 一 次 只 允许 一 方 车 辆 通过 。 


对 于 Wi-Fi 来 说 ， 时 间 也 是 相关 维度 。 不 同 于 分 配 专门 时 段 ，Wi-Fi 
允许 设 备 在 需要 的 时 候 发 送信 号 ， 只 要 频道 对 其 来 说 是 空闲 的 。 换 句 话 
说 ， 它 要 求 设备 一 直 了 解 其 他 设备 的 状态 ， 以 防止 碰撞 。 这 就 像 司 机 来 


到 停车 标志 前 : 他 必须 向 两 侧 看 看 ， 确 保 没 有 人 来 ， 然 后 才能 继续 行 
驶 。 


这 两 种 技术 都 是 媒体 访问 控制 (medium access control) 的 方 
法 。TDMA 是 一 种 专线 访问 形式 ， 而 Wi-Fi 则 由 随机 访问 (random 
access) 控制 。 


我 们 可 以 再 回想 一 下 鸡尾酒 会 的 比喻 〈 见 图 2-5) ， 那 里 客人 的 声 
自 空 中 此 起 彼 伏 。 当 干扰 声 很 强 时 ， 你 无 法 理解 朋友 想 说 什么 。 
TDMA 束 像 给 客人 分 配 不 同时 间 ， 安 排他 们 在 不 同 的 时 段 说 话 。 随 机 访 
问 在 时 间 上 将 客人 人 分开， 但 不 给 他 们 分 配 时 段 ， 而 是 在 茶 个 时 间 ， 只 要 
没有 别人 说 话 ， 就 允许 菜 位 客人 说 话 。 


oe i 二 


pt n 次 


图 2-5 重 回 鸡尾酒 会 的 比 只 


使 用 随机 访问 时 ， 每 台 设 备 都 需要 遵守 一 定 的 程序 ， 决 定 何 时 发 送 
及 传输 时 间 的 长 度 。 时 段 由 所 有 设备 共享 ， 因 为 它们 可 以 在 需要 时 冬 试 
使 用 传输 媒介 ， 只 要 其 目前 没有 被 其 他 设备 占用 。 换 句 话说 ，Wi-Fi 协 
议 要 求 每 台 设 备 遵循 某 种 “礼貌 程序 ”"。 该 程序 的 名 称 是 载波 侦 听 多 址 访 
间 (carrier sensing multiple access) ， 简 称 CSMA， 因 为 每 台 设备 
都 试图 “ 侦 听 ”在 频道 中 的 其 他 设备 的 存在 。 


像 第 1 章 中 的 DPC 那样 ，CSMA 是 一 个 完全 分 布 式 的 程序 。 每 台 设 
备 都 使 用 其 通过 上 自己 对 频道 的 观察 所 收集 的 信息 在 本 地 执行 ， 它 不 需要 
某 个 中 央 协 调 器 来 协助 决策 ， 这 是 另 一 个 分 布 式 协调 成 为 网 络 连接 关键 


主题 的 例子 。 


当 设 备 数量 较 少 时 ，Wi-EFi 可 以 达到 可 观 的 比特 率 。 然 而 ， 随 着 越 
来 越 多 的 设备 开始 争夺 相同 的 接 入 点 ， 速 度 将 大 幅 下 降 。 在 探讨 CSMA 
之 前 ， 让 我 们 思考 一 个 简单 的 随机 访问 协议 ， 以 便 更 加 容易 地 量化 性 能 
如 何 随 着 设备 增加 而 降低 。 


阿 罗 哈 (来 自 夏威夷 ) 


如 图 2-6 所 示 ， 有 A、B 和 C 三 台 发 射 器 ， 以 及 D 和 E 两 个 接 入 氮 。A 
和 B 要 及 送 到 D，C 要 及 送 到 E， 并 且 它 们 都 在 彼此 的 干扰 范围 内 。 


图 2-6 Wi-Fi 拓 扑 示例 
注 : 两 个 访问 点 0D 和 E 的 范围 由 虚线 表示 


在 一 个 时 段 的 开始 ， 每 台 设 备 都 面临 以 下 问题 : 我 应 该 发 送 一 个 帧 
吗 ? 这 个 “决策 ”过 程 的 部 分 可 能 结果 如 图 2-7 所 示 。 如 果 所 有 的 Wi-Fi 站 
点 (station) 总 是 给 出 表 定 回答 ， 那 冲突 会 一 直 存 在 。 这 显然 是 一 个 
不 理想 的 情况 。 站 点 有 时 必须 避免 发 送 ， 以 便 让 其 他 设备 的 数据 通过 。 
反 过 来 ， 它 应 该 期 待 其 他 设备 会 中 断 发 送 ， 以 便 它 可 以 尽快 传输 数据 。 


时 间 


] 2 3 了 


图 2-7 图 2-6 中 站 点 A~C 在 四 个 传输 时 段 的 示例 
注 : 第 三 个 时 段 是 “浪费 的 机 会 ”， 因 为 在 此 期 间 没 有 设备 传输 


我 们 可 以 通过 许多 不 同 的 因素 来 确定 一 个 站 点 是 否 传 输 ( 例 如， 其 
最 近 是 否 发 生 了 数据 碰撞 ) 。 如 果 我 们 干脆 在 每 个 时 段 给 它 分 配 一 个 固 
定 的 概率 呢 ? 如 果 概 率 是 50%， 那 么 站 点 将 在 一 半 时 间 发 送 ， 另 一 半 时 
间 暂 停 。 如 果 是 10%， 那 么 它 会 平均 每 10 次 发 送 一 次 ， 并 在 其 他 9 次 暂 
停 。 这 种 方法 实际 上 是 阿 罗 哈 (Additive Links On-line Hawaii 
Area， 简 称 ALOHA) 协议 的 基础 ， 它 于 1971 年 由 夏威夷 大 学 的 诺 曼 . 
艾 布 拉 姆 森 发 明 。 显然， 这 个 缩写 并 不 是 巧合 ! ) 


图 2-8 显 示 ， 当 我 们 增加 ALOHA 中 的 传输 概率 时 ， 将 会 出 现 什么 情 
况 。 概 率 越 高 ， 发 送 的 帧 越 多 ， 碰 撞 的 可 能 性 就 越 大 。 但 如 果 概 率 太 
低 ， 我 们 又 将 浪费 很 多 机 会 。 问 题 是 ， 哪 个 选择 会 使 香 吐 量 
(throughput) “信息 传递 的 成 功率 ) 尽 可 能 高 呢 ? 


一 
站 点 


时 间 
注 : 这 是 传输 概率 增加 时 会 出 现 的 情况 

一 切 都 归结 于 吞吐 量 

在 每 个 时 段 中 ， 有 三 种 可 能 的 结果 : (1) 成 功 传输 ( 即 一 个 站 点 


发 送 ) ; (2) 碰撞 〈 即 多 个 站 点 同时 发 送 ) ; (3) 没有 传输 ( 即 没有 
站 扣发 送 ) 。 在 模拟 吞吐 量 时 ， 第 一 种 情况 对 我 们 最 有 利 。 


要 实现 成 功 传输 ， 我 们 需要 满足 两 个 条 件 。 首 先是 有 人 进行 发 送 。 
对 于 任何 一 个 站 点 来 说 ， 这 一 条 件 发 生 的 概率 就 是 实现 传输 的 概率 。 


第 二 个 条 件 是 其 他 站 点 不 传输 。 这 个 概率 有 多 大 ? 某 个 站 点 不 传输 
的 概率 与 其 传输 概率 相对 。 人 例如， 如果 传输 的 概率 为 40%， 那 么 不 传输 
的 概率 为 60%。 由 于 我 们 需要 所 有 其 他 站 点 不 发 送 ， 那 么 通过 乘法 : 其 
他 两 个 站 点 不 传输 的 概率 是 0.6x0.6 = 0.36， 或 36%; 其 他 三 个 站 点 不 传 
输 的 概率 是 0.6x0.6x0.6 = 0.216， 或 21.6%; 以 此 类 推 。 


那么 ， 一 个 站 点 成 功 传输 的 概率 是 多 少 呢 ? 我 们 用 茶 个 站 点 传输 的 
概率 乘 以 所 有 其 他 站 点 不 传输 的 概率 ， 也 就 是 : 


传输 的 概率 x 不 传输 的 概率 x.…..x 不 传输 的 概率 
例如 ， 如 果 A、B 和 C 是 仅 有 的 传输 站 点 ， 并 且 每 个 站 点 传输 的 概率 


为 40%， 那 么 ，A 传 输 成 功 的 概率 是 0.4x0.6x0.6 = 0.14， 或 14%。 


这 是 阿 罗 哈 各 站 点 厨 吐 量 的 测量 方法 ， 也 就 是 东 个 站 点 在 任何 一 个 
时 段 传 输 成 功 的 概率 。 在 刚才 的 例子 中 ，A 得 到 了 信道 可 以 提供 的 14% 
的 时 段 ， 而 不 受到 干扰 。 


要 计算 系统 的 总 吞吐 量 ， 我 们 可 以 把 每 个 站 点 的 吞吐 量 相 加 。 对 于 
上 面 提 到 的 三 个 站 点 A、B 和 C， 它 们 的 总 知 叶 量 为 0.14x3=0.42， 或 
42%。 总 体 而 言 ， 在 无 干扰 的 情况 下 ， 该 系统 能 取得 不 到 一 半 的 吞吐 


三 


里 。 
及 送 还 是 个 及 送 
刚才 我 们 看 到 的 是 影响 阿 罗 哈 吞吐 量 的 两 个 因素 : 


。 某 个 站 点 在 一 个 时 段 中 发 送 的 概率 。 
。 在 干扰 范围 内 的 站 点 数量 。 


虽然 很 难 控 制 人 们 何 时 进入 和 离开 Wi-Fi 区 域 ， 但 我 们 可 以 将 执行 
传输 概率 作为 “礼貌 ”程序 的 一 部 分 。 那 么 我 们 应 该 如 何 选择 这 个 值 呢 ? 


让 我 们 确定 站 点 的 数量 ， 看 看 改变 传输 概率 的 影响 是 什么 。 回 到 图 
2-6: A 到 E 中 ， 哪 些 是 站 点 ? 事实 上 ， 全 部 都 是 : 设备 (A、B 和 C) 和 
接 入 点 (D 和 E) 都 需要 发 送 数据 。 为 了 简化 问题 ， 前 面 我 们 只 关注 设 
备 。 


图 2-9 显 示 了 ， 随 着 传输 概率 变化 ，5 个 站 点 的 总 吞吐 量 和 单 站 吞吐 
量 情况 。 从 左边 开始 ， 我 们 看 到 ， 概 率 增 加 在 刚 开始 时 会 使 性 能 提高 : 
当 概 率 很 小 时 ， 没 有 或 很 少 发 生 数据 碰撞 ， 所 以 我 们 只 是 填补 被 浪费 的 
时 段 ， 提 高 吞吐 量 。 一 旦 发 送 概率 达到 20%， 图 中 的 曲线 达到 约 40% 的 


最 高 总 否 叶 量 。 之 后 ， 否 吐 量 束 会 下 降 : 如 果 继 续 增 加 传输 会 造成 更 多 
的 冲突 ， 而 不 会 再 提高 否 吐 量 。 


一 一 总 在 叶 量 一 -- 单 站 存 吐 量 


传输 概率 (%) 
图 2-9 5 个 站 点 的 阿 罗 哈 协议 总 吞吐 量 和 单 站 吞吐 量 曲线 


因此 ， 对 于 5 个 站 点 来 说，209% 是 最 佳 传输 概率 ， 最 大 吞吐 量 为 
40%。 这 音 味 着 ， 最 好 的 情况 是 每 五 个 时 段 中 有 两 个 传输 成 功 ， 这 已 经 
不 是 非常 有 效率 了 。 当 我 们 增加 更 多 站 点 时 会 发 生 什 么 ? 这 会 带 来 更 多 
的 潜在 干扰 ， 我 们 可 以 通过 进一步 减少 传输 概率 来 应 对 。 事 实证 明 ， 可 
达到 的 最 大 否 吐 量 基本 稳定 ， 并 且 随 着 站 点 数量 增加 到 一 定 程度 ， 它 会 
绥 慢 下 降 到 37%。 如 末 你 对 详细 的 曲线 图 感 兴 趣 ， 请 参考 本 书 网 站 Q2.7 


部 分 。 


忆 的 来 说 ， 阿 罗 蛤 并 不 能 很 好 地 扩展 到 大 量 用 户 。 这 是 Wi-Fi 的 一 
个 总 体 情况 ， 也 是 我 们 为 简单 协议 付出 的 代价 。 


在 组 合 中 加 入 感 测 


因此 ，Wi-EFi 在 使 用 阿 罗 哈 方面 有 很 多 问题 。 问 题解 决 了 吗 ? 解决 
了 一 部 分 : 目前 的 Wi-Fi 协 议 使 用 CSMA， 以 便 能 达到 更 高 的 否 吐 量 。 


阿 罗 哈 没有 试图 协调 站 点 的 传输 。 当 然 ， 它 通过 让 人 们 传输 得 更 
少 ， 减 少 了 冲突 的 次 数 ， 并 进行 随机 决定 。 但 是 ， 如 采 我 现在 有 很 多 数 
据 要 发 送 ， 而 时 段 却 在 没有 人 发 送 时 开放 呢 ? 如 果 我 的 随机 “硬币 投 
皂 ” 告 诉 我 不 要 及 送 ， 那 么 我 束 不 友 送 ， 这 将 浪费 一 个 机 会 。 同 样 ， 如 
果 信 道 当前 被 占用 ， 我 应 该 能 够 知道 ， 并 暂停 发 送 。 


问题 是 ， 阿 多哈 是 纯粹 随机 的 ， 并 且 不 进行 感 测 。 在 停车 标志 的 比 
喻 中 ， 这 就 像 用 眼罩 蒙 住 你 的 眼睛 ， 让 你 随机 选择 何 时 前 进 ， 而 不 看 是 
人 否 有 车 来 。 显 然 ， 这 将 是 非 第 危险 的 ， 有 可 能 导致 车 辆 页 撞 (虽然 两 帧 
数据 碰撞 不 太 可 能 有 两 辆 车 相 撞 的 破坏 性 强 〉。 


传 感 载体 


利用 CSMA， 发 送 器 在 发 送 任何 帧 之 前 ， 都 会 定期 侦 听 空间 情况 。 
这 被 称 为 载波 侦 听 (carrier ” sensing) 。 你 可 以 在 图 2-10 中 看 到 示 
例 : A 和 C 可 以 侦 听 到 信道 目前 被 占用 ， 就 不 会 发 送 任何 数据 ， 直 到 B 传 
输 结束 。 


图 2-1A0 


0 
听 范 

一 旦 站 点 看 到 一 个 空 困 的 信道 ， 它 是 不 是 就 可 以 开始 发 送 了 ? 不 能 
立即 发 送 。 确 切 地 说 ， 它 必须 首先 经 历 所 谓 的 等 竺 和 侦 听 期 。 如 果 在 等 
待 和 侦 昕 期 ， 站 点 在 任何 时 刻 察觉 到 信道 忙碌 ， 那 么 它 将 保持 沉默 ， 束 
像 图 2-11 中 的 站 点 B 一 样 。 这 类 似 于 日 常 对 话 中 发 生 的 情况 : 当 你 认为 
某 人 已 经 结束 讲话 时 ， 在 你 回答 之 前 等 待 几 秒 钟 是 常见 的 礼貌 行为 。 


一 旦 等 待 和 侦 听 期 结束 ， 站 点 也 没有 听 到 任何 其 他 情况 ， 便 可 以 认 
定 信道 空闲 ， 并 开始 发 送 。 在 图 2-11 中 ， 这 首先 发 生 在 A 身 上 ， 然 后 是 
B。 显 然 ， 即 使 站 点 在 等 待 之 后 ， 它 们 的 帧 仍然 有 可 能 发 生 碰 撞 。 因 为 
也 许 男 一 个 站 点 和 它 同时 开始 等 待 ， 并 同时 决定 发 送 。 


等 待 和 
| 侦 听 
二 
A 
等 竺 和 
| | | 侦 听 
B 
时 间 
侦 听 到 忙碌 


图 2-11 


注 : 在 发 送 之 前 ， 站 点 必须 经 历 一 个 完整 的 等 待 和 侦 听 期 ， 其 间 没 有 听 到 任何 通过 
它 的 传输 


站 点 如 何 知 道 它 发 送 的 帧 是 否 被 正确 接收 ? 答案 是 通过 反馈 。 利 用 
CSMA， 当 一 帧 数据 和 家 接收 ， 接 收 者 将 发 送 一 条 确认 消 妃 〈 或 ACK 帧 ) 
给 发 送 者 ， 千 诉 它 一 切 都 好 。 在 传输 ACK 帧 之 前 ， 也 有 一 个 等 待 和 侦 听 
期 。 如 宁 发 送 者 没有 收 到 来 目 接收 者 的 确认 消 轧 ， 就 可 以 认为 发 生 了 友 
撞 。 你 可 以 在 图 2-12 中 看 到 示例 。 


等 待 和 


E 


图 2-12 


注 : 图 2 -10 中 的 站 点 B 需 要 发 送 。 在 侦 听 到 空间 空闲 后 ， 它 经 过 等 竺 和 侦 听 期 ， 并 
最 终 开 始 向 D 传 输 。 然 后 D 向 B 发 回 确认 消息 。B 收 到 确认 消息 ， 得 知 一 切 顺 利 。 在 此 
之 后 ，A 和 0 没有 听 到 任何 情况 ， 于 是 它们 经 过 等 待 和 侦 听 期 ， 并 在 同一 时 间 开 始 传 
输 。 它 们 没有 得 到 确认 消息 ， 于 是 意识 到 碰撞 发 生 


耐心 是 一 种 美德 


发 生 碰撞 该 怎么 办 ? 每 个 站 点 都 需要 退 避 到 稍 后 的 时 间 ， 到 时 它们 
将 再 次 答 试 及 送 帧 。 问 题 是 ， 站 点 如 何 选择 退 避 到 什么 时 间 ? 显然 ， 我 
们 不 希望 它们 选择 同一 时 间 : 这 将 导致 男 一 次 碰撞 。 


相反 ，CSMA 让 每 个 站 点 选择 未 来 再 次 发 送 的 随机 时 间 。 未 来 的 这 
个 时 间 点 由 当前 竞争 窗口 (contention window) 的 大 小 决定 。 如 果 
一 个 站 点 当前 的 竞争 窗口 是 3， 那 么 它 会 选择 一 个 在 0O 和 3 之 间 的 随机 
数 。 它 选择 的 数字 决定 它 在 再 次 发 送 前 等 待 多 少时 段 〈 例 如 ， 如 果 它 选 


择 2， 则 会 等 待 2 个 时 段 ) 。 


你 可 以 在 图 2-13 中 看 到 这 个 过 程 ， 图 中 显示 两 个 站 点 发 生 碰 撞 的 情 
况 。 首 先 ， 它 们 经 历 了 第 二 次 等 等 和 侦 听 期 。 然 后 ， 它 们 选择 0 和 
15〔 和 窗口 大 小 ) 之 间 的 随机 数 ， 以 确定 何 时 再 次 发 送 。 


站 点 等 竺 和 0 15 


随机 选择 时 段 : 3 


图 2-13 

注 : 当 A 和 B 意 识 到 已 经 发 生 碰 撞 时 ， 它 们 根据 竞争 窗口 的 大 小 〈15) 向 未 来 时 间 退 
避 

随机 选择 的 目的 是 降低 站 点 再 次 碰撞 的 概率 。 当 然 ， 站 点 也 有 可 能 
选择 相同 的 时 段 。 也 许 它们 会 和 不 同 发 射 器 共同 发 生 倍 撞 。 如 果 幅 不 断 
磁 撞 ， 空 中 的 干扰 状况 必定 相当 严重 。 因 此 ， 所 有 过 到 持续 帧 碰撞 的 站 
点 都 会 开始 更 积极 的 退 避 ， 它 们 通过 增加 竞争 窗口 大 小 来 达到 这 一 目 
标 。 


为 了 更 好 地 理解 这 一 点 ， 我 们 可 以 回 到 鸡尾酒 会 的 比喻 。 假 设 你 在 
房间 里 和 一 群 人 聊天 ， 并 且 你 有 话 要 说 。 正 在 说 话 的 人 突然 停止 ， 这 时 
你 就 开始 进入 你 的 内 部 “等 每 和 侦 听 ”期 。 你 可 能 给 对 方 2 秒 钟 的 时 间 ， 
如 果 他 愿意 ， 他 可 以 继续 说 话 ， 或 让 别人 做 出 回应 。 


2 秒 钟 之 后 ， 你 开始 说 话 。 但 有 人 也 开始 说 话 ， 于 是 你 们 发 生 辜 
撞 ， 双 方 者 措手不及 ， 然 后 都 俘 下 来 。 你 退 避 ， 等 竺 2 秒 ， 然 后 答 试 “再 


次 发 送 ”。 但 对 方 同样 等 了 2 秒 ， 你 们 再 次 人 碰撞。 这 次 你 等 的 时 间 更 长 ， 
比如 退 避 4 秒 。 对 方 也 一 样 ， 但 还 是 引起 了 另 一 次 全 撞 。 然 后 ， 出 于 礼 
貌 ， 你 决定 等 待 8 秒 。 最 后 ， 对 方 趁 你 没有 出 声 的 时 候 ， 开 始 说 话 。 


这 里 有 什么 问题 ?为 什么 “ 退 避 ”在 之 前 的 尝试 中 没有 出 现 ? 因 为 你 
们 刚好 都 等 待 了 同样 的 时 间 。2 秒 ， 然 后 4 秒 。 最 后 ， 在 第 三 次 答 试 时 ， 
你 们 都 成 功 发 送 了 消 轧 ， 因 为 你 等 待 了 8 秒 ， 而 你 的 朋友 等 得 较 短 。 这 
就 是 随机 的 重要 性 。 


这 一 间隔 〈2，4，8..….) 就 是 利用 CSMA 增 加 窗口 大 小 速度 : 乘 
以 两 倍 系数 。 线 性 增加 窗口 大 小 〈2，3，4..….) 是 一 种 选择 ， 但 人 们 
认为 它 不 够 积极 ， 所 以 CSMA 要 求 以 乘法 速度 退 避 。 由 于 乘法 倍数 是 
2， 因 此 它 被 称 为 二 进 制 指数 退 避 (binary exponential backoff) 。 


你 可 以 在 图 2-14 中 看 到 二 进 制 指数 退 避 的 示例 。 要 算出 当前 窗口 的 
大 人 小， 我们 需要 用 之 前 的 时 段 数 乘 以 2， 再 减 去 1。 减 去 1 是 因为 我 们 想 
包括 0: 我 们 可 能 不 会 退 避 ， 而 是 立即 发 送 。 最 初 ， 我 们 有 8 个 可 能 的 退 
避 时 段 〈0~7) ， 因 此 我 们 说 窗口 大 小 为 7。 接 下 来 ， 我 们 有 16 个 可 能 的 
退 避 时 段 (0~15， ， 以 此 类 推 。 在 第 13 章 讨论 拥塞 控制 时 ， 乘 法 退 避 将 
再 次 出 现 。 


随机 选择 时 段 : 10 窗口 =31 


1 时 间 
随机 选择 时 段 : 7 
图 2-14 Wi-Fi 载 波 侦 听 多 址 访问 重复 出 现 退 避 的 示例 

注 : 碰撞 导致 竞争 窗口 长 度 加 信 

CSMA 还 有 许多 错综复杂 的 情况 ， 我 们 没有 时 间 去 讨论 。 例 如 ， 你 
可 能 与 你 侦 听 不 到 的 信号 发 生 碰 撞 ， 这 就 是 所 谓 的 隐藏 节 点 问题 
(hidden node problem) 。 除 非 你 能 采取 其 他 预防 措施 ， 否 则 它 将 
成 为 一 个 问题 。 


和 阿 多 哈 进 行 比较 


当 参 数 经 过 适当 调整 后 ， 相 比 阿 罗 哈 ，CSMA 会 有 更 显著 的 性 能 
进 。 一 方面 ， 虽 然 单 站 吞吐 量 仍然 会 随 着 站 点 增加 而 下 降 ， 但 下 降 速 度 
低 于 使 用 阿 罗 哈 时 的 下 降 速度 。 另 外 ， 通 过 CSMA， 总 吞吐 量 将 在 增加 
前 几 个 站 点 时 上 升 ， 而 在 使 用 阿 罗 哈 时 这 个 数字 总 是 降低 。 


但 CSMA 并 不 能 完全 解决 碰撞 问题 。 事 实 上 ， 在 添加 几 个 站 点 后 ， 
CSMA 中 的 总 吞吐 量 也 将 开始 下 降 。 虽 然 它 比 起 阿 罗 哈 有 所 改进 ， 但 随 
看 站 点 增加 ， 其 下 降 速 度 仍 会 大 大 增加 。 


总 体面 音 ， 汪 他 在 癌 岁 险 壕 古 CSMA 虱 无 污 为 六 量 Wi- 王 设备 打 展 
性 能 。 这 就 是 人 很 多 时 ， 热 点 性 能 不 佳 的 原因 。 这 是 我 们 为 网 络 拥塞 所 


付出 的 代价 。 

到 目前 为 止 ， 本 书 的 重点 是 关于 帮助 我 们 共享 网 络 媒体 特别 是 空 
间 ) 的 不 同方 法 。 但 是 ， 关 于 应 该 如 何 计算 我 们 为 消耗 的 资源 收费 的 方 
法 ， 还 没有 涉及 。 网 络 定价 也 可 以 成 为 实现 更 高 效 共享 的 有 效 途径 ， 我 
们 将 转 到 这 个 话题 上 。 


第 3 章 


聪明 地 为 数据 定价 


数据 费用 是 我 们 手机 账单 的 重要 部 分 。 电 信 运 营 商 如 何 设置 这 些 价 
格 点 ? 在 本 章 中 ， 我 们 将 看 到 ， 相 比 统一 费 率 或 “自助 餐 ” 式 的 计划 ， 所 
请 的 基于 使 用 的 定价 方案 如 何 为 我 们 发 送 更 好 的 反馈 信号 ， 让 共享 更 好 
地 实现 。 定 价 可 以 成 为 管理 网 络 的 有 效 方式 。 


像 目 助 餐 一 样 的 定价 


电信 合同 中 的 数据 计划 表示 我 们 为 消耗 的 数据 支付 了 多 少 弗 用。 这 
些 计划 首先 由 移动 电话 服务 商 推 出 ， 作 为 一 种 为 短信 收费 的 方式 ， 现 在 
它 包 括 我 们 在 手机 上 使 用 的 所 有 互联 网 应 用 ， 如 上 网 、 在 线 视 频 和 视频 
聊天 。 


这 些 计划 是 如 何 构 成 的 ? 想 想 我 们 的 公用 事业 账单 ， 电 力 、 水 、 燃 
气 等 是 如 何 计 费 的 。 它 们 通常 是 基于 我 们 所 消耗 的 服务 量 。 例 如 ， 如 果 
电力 公司 为 每 度 电 收费 10 美 分 ， 那 么 使 用 500 度 电 的 人 将 文 付 50 美 元 ， 
而 如 果 和 人们 把 消耗 的 电量 减 半 ， 那 么 就 只 有 25 美 元 。 这 种 “用 的 多 ， 花 
的 多 ”的 定价 方案 昕 起 来 通俗 易 懂 。 数 据 计 划 也 是 这 样 计 费 的 吗 ? 


越 来 越 多 的 答案 是 肯定 的 ， 但 仅 在 过 去 几 年 是 这 样 。 尺 管 提供 无 线 
蜂窝 容量 昂贵 且 难 以 增加 ， 但 在 一 些 国家 (例如 美国 ) ， 消 费 者 过 去 每 
月 只 需 支付 固定 的 数据 费用 ， 不 管 他 们 消耗 了 多 少 移动 数据 。 这 种 方案 
被 称 为 统一 费 率 (flat-rate) 定价 。 


目 助 餐 好 吗 ? 


统一 费 率 是 什么 意思 ? 它 不 取决 于 你 实际 消费 了 了 多少。 想象 一 家 提 
供 自助 餐 的 餐厅 (如 图 3-1 所 示 )〉: 文 付 一 定 费 用 进门 后 ， 你 可 以 想 吃 
多 少 束 吃 多 少 。 效 仿 他 人 对 你 最 有 利 :， 因为 无 论 你 吃 一 盘 、 两 盘 还 是 五 
盘 食物 ， 都 不 会 多 付 一 分 钱 ， 所 以 ， 趁 你 有 机 会 ， 能 吃 什 么 就 吃 什 么 。 


@ @@ 
NA 


AA、 过 
ss 
HA HH 


2 
Ee 
~“ 
2 
Dt, 


图 3-1 


注 : 自助 餐厅 基于 统一 费 率 定价 


目 助 餐 对 你 来 说 很 划算 ， 尤 其 是 当 你 饿 的 时 候 。 但 是 ， 如 果 你 不 想 
唉 太 多 ， 可 能 就 不 那么 合适 了 ， 因 为 只 为 少量 食物 ， 你 就 要 文 付 目 助 餐 
的 价格 。 再 从 和 餐厅 的 角度 来 思考 : 如 果 人 们 每 次 光顾 时 ， 都 会 吃 掉 更 多 
的 食物 呢 ? 如 采 顾 客 的 饭量 每 年 都 翻 倍 ， 那 餐厅 还 能 以 相同 的 价格 提供 
目 助 餐 吗 ? 


多 年 来 ， 移 动 行业 的 数据 计划 基于 统一 费 紊 定价 ， 而 语 首 计划 则 不 
是 。 原 因 是 ， 过 去 几 十 年 中 ， 无 线 运 营 商 把 语音 通 话 和 信息 视 为 手机 的 
主要 用 途 ， 而 不 是 移动 数据 。 通 过 支付 人 条 个 费 率 ， 比 如 每 月 30 美 元 ， 网 
络 将 成 为 你 的 “ 目 助 餐 ”， 让 你 随心 所 欲 地 使 用 数据 。 很 长 一 段 时 间 以 
来 ， 这 样 的 计划 对 于 供应 商 是 有 意义 的 ， 因 为 蜂 负 设备 所 消耗 的 数据 量 


很 低 。 手 机 的 主要 目的 是 语音 通话 ， 数 据 被 视 为 次 要 的 附加 功能 。 


随 独 智能 手机 的 普及 ， 这 种 情况 迅速 改变 。 由 于 手持 设备 能 够 浏览 
网 页 、 在 线 播 放 音 乐 视 频 ， 并 文 持 其 他 各 种 数据 密集 型 应 用 程序 ， 因 
此 ， 人 们 对 数据 的 需求 开始 迅速 上 升 。 例 如 ，2007 年 推出 的 第 一 代 竺 果 
手机 使 蜂 离 数据 需求 峰 升 50 倍 。 许 多 应 用 程序 也 能 够 在 后 台 运 行 〈 不 需 
要 人 在 妨 一 方 操 作 ， ， 并 且 很 快 机 器 之 间 和 设备 之 间 的 直接 通信 也 将 创 
造 更 多 的 数据 需求 。 除 了 新 的 应 用 之 外 ， 使 用 智能 手机 的 人 数 也 在 刺激 
数据 需求 增加 。 


“乔布斯 的 容量 不 平等 ” 


图 3-2 显 示 了 ， 截 至 2015 年 移动 数据 流量 传输 的 规模 ， 并 预计 出 到 
2019 年 将 增加 的 数量 。 字 节 (byte) 是 衡量 数据 大 小 的 单位 ， 但 一 个 
字 节 是 相当 小 的 数量 : 一 个 音频 文件 通常 包含 数 百 万 字 节 ， 而 一 个 视频 
可 能 有 数 十 亿 字 节 。 所 以 ， 我 们 通常 将 数据 大 小 表示 为 兆 字 (MB， 
他 舍 百 广 守节 》 3 往生 北 字 节 C6By 季 合 二 化 守节 》。 在 图 3 了 2 中 笋 
字 单 位 为 艾 字 节 ， 一 个 艾 字 节 相 当 于 十 亿 王 兆 字 节 。 这 意味 着 ， 在 2015 
年 每 月 有 42 亿 GB 的 移动 数据 通过 互联 网 传输 ! 该 数字 还 在 增加 ， 预 计 
未 来 将 以 每 年 约 50% 的 速度 增加 。 


每 月 移动 数据 艾 字 节 数 


2012 2013 2014 2015 2016 2017 2018 2019 (年 份 ) 


图 3-2 每 年 单 月 移动 数据 流量 图 
注 : 由 思科 公司 预测 至 2019 年 


哪些 应 用 占据 了 大 部 分 的 数据 消费 ?图 3-3 将 2014 年 的 数据 按 应 用 
类 型 划分 。 其 中 ， 在 线 视频 约 占 55%， 消 费 了 最 多 的 数据 ， 其 次 是 网 页 
浏览 ， 约 占 36%。 两 者 之 和 占 所 有 数据 需求 的 比例 超过 90%。 除 了 有 限 
的 网 页 浏览 ， 在 智能 手机 和 平板 电脑 出 现 前 ， 这 些 功能 都 是 无 法 在 移动 
设备 上 使 用 的 。 


在 线 音 频 z 文件 共享 


图 3-3 


正如 自助 餐 只 提供 有 限 的 食物 给 顾客 ， 网 络 也 只 有 有 限 的 能 力 来 文 
持 数据 流 进出 我 们 的 设备 。 在 史 蒂 夫 :乔布斯 于 2007 年 推出 第 一 款 苹果 
手机 后 不 入， 残 有 人 人 预测， 数据 需求 的 增长 正在 超过 供应 量 的 增长 速 
度 。 因 为 供应 量 只 会 随 着 提高 网 络 容量 方面 的 投资 的 增加 而 增加 。 多 年 
来 ， 两 者 的 差距 一 直 在 扩大 。 


你 可 以 在 图 3-4 中 看 到 这 种 趋势 的 略图 。 我 们 称 其 为 “乔布斯 的 容量 
不 平等 ”"。 一 旦 工程 师 和 开发 人 员 想 出 让 使 用 移动 互联 网 数据 更 方便 、 
更 有 吸引 力 的 方法 ， 用 户 需 求 ( 以 及 数据 应 用 创新 〉 便 会 开始 迅速 增 
长 ， 并 超过 供应 增长 的 步伐 。 
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图 3-4 随 着 时 间 的 推移 ， 移 动 数据 容量 的 需求 和 供给 趋势 


没有 技术 可 以 每 年 无 止境 地 大 幅 提 高 成 本 效益 。 需 要 有 一 种 调 市 需 
求 的 方法 ， 使 其 与 容量 保持 一 致 ， 使 网 络 能 够 更 有 效 地 共 衬 。 


用 的 多 ， 人 花 的 多 


互联 网 服务 提供 商 〈ISP) 想 出 的 办 法 是 什么 ? 它们 不 再 收取 统一 
费 率 ， 而 是 开始 转向 基于 使 用 (usage-based) 的 定价 方案 ， 根 据 每 
月 消费 的 数据 量 向 用 户 收取 费用 。 这 种 收费 方式 向 消费 者 发 出 不 同 的 定 
价 信号 : 他 们 不 是 无 论 每 个 月 使 用 多 少 都 按 统一 费 率 缴费 ， 而 要 为 自己 
消费 的 每 一 批 数据 支付 费用 。 你 可 以 在 图 3-5 中 看 到 : 统一 费 率 完全 独 
立 于 实际 消费 ， 而 基于 使 用 的 收费 标准 为 超过 某 个 定额 的 每 批 数 据 收取 
额外 费用 。 基 于 使 用 定价 的 “阶梯 *"， 其 具体 形状 取决 于 给 定时 间 内 运营 
商 的 定价 细节 。 


统一 费 率 基于 使 用 定价 


术 
每 月 消费 数据 每 月 消费 数据 
图 3-5 
注 : 统一 费 率 和 基于 使 用 的 定价 向 消费 者 发 出 不 同 的 信号 。 在 基于 使 用 定价 的 方案 
中 ， 使 用 超过 定额 的 数据 (例如 每 个 额外 的 GBB) 就 会 增加 每 月 费用 ， 这 种 增长 趋势 
呈 “ 阶 梯 ” 形 状 。 统 一 费 率 则 完全 独立 于 每 月 的 实际 消费 


这 个 由 网 络 发 出 的 信号 成 为 一 种 给 客户 的 负 反 馈 形 式 。 在 第 1 章 
中 ， 我 们 看 到 了 功率 控制 的 负 反 馈 : 基于 信道 条 件 ， 网 络 反 馈 测 量 信和 号 
干扰 比 ， 以 调节 每 人 台 设 备 的 信号 功率 。 第 2 章 中 ，Wi-Fi 随 机 访问 的 确认 
也 是 一 种 负 友 饶 ， 我 们 将 在 第 13 章 互联 网 拥塞 控制 部 分 更 具体 地 探讨 这 
一 问题 。 在 本 章 中 ， 网 络 通过 反馈 基于 使 用 的 价格 ， 根 据 现 有 容量 调整 
每 个 用 户 的 需求 。 从 而 要 求 每 个 消费 者 将 其 对 网 络 的 负 外 部 性 《〈 即 其 引 
起 的 拥 去 ) 加 以 内 化 ， 为 自己 消费 的 数据 量 文 付费 用 。 反 馈 再 次 成 为 网 


络 资 源 共 至 的 一 个 共同 主题 。 


基于 使 用 的 转移 


推出 基于 使 用 的 定价 标准 有 两 个 典型 的 先决 条 件 。 首 先是 整个 市 场 
的 网 络 使 用 量 激增 ， 且 其 需求 增长 速度 将 超过 供应 量 的 增 速 。 对 于 蜂窝 
网 络 而 言 ， 这 种 趋势 发 生 在 苹果 手机 、 安 里 智能 手机 和 平板 电脑 推出 之 
后 。 更 多 的 用 户 和 性 能 更 强 的 设备 促使 需求 不 断 增长 ， 导 致 用 户 消耗 更 
多 的 数据 。 这 使 得 互联 网 服务 提供 丙 的 成 本 更 高 ， 因 为 它们 必须 提供 额 


外 的 容量 。 基 于 使 用 的 定价 有 助 于 使 互联 网 服务 提供 商 的 收入 赶 上 为 文 
持 需 求 上 升 带 来 的 成 本 。 


第 二 个 条 件 是 政府 法 规 允 许 定价 模式 创新 。 虽 然 这 种 模式 涉及 许多 
监 上 问 题 ， 但 使 每 月 费用 与 使 用 量 成 正比 是 争议 最 少 的 方案 。 


到 2010 年 ， 美 国 已 经 开始 转 同 基于 使 用 的 定价 方案 。 同 年 4 月 ， 
AT&T (类 国电 话 电 报 公 司 〉 公布 了 为 3G 数 据 用 户 提 供 的 基于 使 用 的 定 
价 方案 。 次 年 3 月 ， 威 瑞 森 紧 随 其 后 ， 先 为 苹果 手机 和 苹果 平板 电脑 用 
户 提供 此 类 方案 ， 然 后 在 2011 年 为 所 有 3G 数 据 用 户 推出 新 方案 。2012 
年 3 月 ，AT&T 对 之 前 使 用 无 限 数据 计划 的 消费 者 宣布 ， 一 旦 使 用 量 超 
过 定额 ， 其 连接 速度 将 节 流 《〈 即 下 降 ) 。 此 后 不 入 ，AT&T 和 威 瑞 秩 无 
线 为 "新华 果 平 板 电脑 ?推出 4G 数 据 计 划 ， 并 宣布 不 再 提供 任何 类 型 的 无 
限 数据 选择 。 


2012 年 6 月 ， 威 瑞 森 公司 再 次 更 新 其 手机 定价 计划 。 客 户 能 以 统一 
寓 率 获得 语音 和 短信 服务 ， 作 为 将 其 无 限 数据 计划 转换 为 基于 使 用 的 计 
划 的 补偿 。AT&T 在 1 个 月 后 采取 了 类 似 的 措施 。 世 界 上 许多 其 他 国家 
也 已 经 采取 或 正在 考虑 类 似 的 措施 ， 为 3G、4G 甚 至 有 线 网 络 推 出 新 方 
和 案 。 运 营 商 认 为 ， 相 比 于 语音 ， 基 于 使 用 的 定价 方案 对 数据 更 重要 ， 因 
为 手机 的 “主要 ?用途 现在 已 经 从 语音 通话 转换 到 数据 应 用 上 。 


除了 纯粹 的 容量 限制 ， 还 有 其 他 原因 促使 互联 网 服务 提供 商 转换 到 
基于 使 用 的 定价 模式 上 。 其 中 一 个 重要 的 原因 是 ， 最 重度 的 数据 用 户 也 
古 需 求 增加 最 多 的 用 户 。 如 采 根 据 用 户 的 使 用 情况 把 他 们 分 成 三 类 : 轻 
度 、 中 度 和 重度 ， 就 会 出 现 图 3-6 显 示 的 情况 。 当 我 们 顺 着 图 的 横 坐 标 
问 右 看 时 ， 会 发 现 需 要 如 此 多 容量 的 用 户 在 逐渐 减少 。 但 在 决定 互联 网 
服务 提供 商 管 理 网 络 的 成 本 时 ， 最 右边 、 最 重度 的 用 户 往 往 是 主导 因 
素 。 这 个 尾巴 一 直 很 长 ， 意 味 着 有 少数 用 户 消 耗 了 大 量 数据 ， 但 现在 尾 


巴 更 长 了 。 随 着 尾巴 变 长 ， 成 本 和 收益 之 间 的 差距 会 不 断 增加 ， 除 非 改 
变 定价 方法 。 


用 户 比 例 


用 量 ( GB) 


图 3-6 


注 : 有 些 人 是 轻 度 数据 使 用 者 ， 有 些 人 是 中 度数 据 使 用 者 ， 还 有 少数 是 重度 数据 使 
用 者 。 尾 部 的 重度 使 用 者 是 决定 互联 网 服务 提供 商 成 本 结构 的 消费 者 


基于 使 用 的 定价 计划 


互联 网 服务 提供 丙 提供 的 基于 使 用 的 数据 计划 是 什么 样 的 ? 在 图 3- 
7 中 ， 你 可 以 看 到 威 瑞 条 在 2016 年 年 初 推 出 的 五 个 计划 。 一 般 来 次 ， 这 
些 计划 主要 有 三 大 特 后: 


120 


费用 (美元 ) 
o 


15 美 元 /GB 


-一 一 -一 一 


人 2 
每 月 消费 的 数据 量 (GB) 
图 3-7 威 瑞 森 在 2016 年 1 月 的 五 项 数据 计划 选择 
注 : 每 条 线 代 表 客 户 可 以 选择 的 一 项 计划 


。 在 一 个 基准 下 ， 收 费 仍 然 采取 统一 费 率 。 人 例如， 中间 的 威 瑞 
森 计 划 将 对 每 月 使 用 不 超过 6 GB 的 用 户 收取 60 美 元 。 

。 对 于 超出 基准 的 部 分 ， 基 于 使 用 的 收费 标准 开始 生效 。 这 些 
威 瑞 森 计划 为 每 增加 的 1G6B 收 费 15 美 元 。 使 用 超过 6 GB 时 ， 中 间 计 划 
开始 收取 15 美 元 / GB 的 费用 。 所 以 你 将 为 7 GB 支付 75 美 元 ， 为 8 GB 
支付 90 美 元 ， 以 此 类 推 。“ 阶 梯 ” 形 状 表示 定价 以 1 GB 为 单位 递 
增 。 

。 总 费用 基于 每 月 的 总 使 用 量 。 使 用 的 时 间 、 地 上 点、 用途 都 不 
重要 ， 唯 一 重要 的 是 你 用 了 多 少 。 


根据 使 用 量 来 收费 听 上 去 很 直观 。 毕 竟 ， 大 多 数 公用 事业 品 和 商品 
都 是 这 样 计 费 的 。 但 那些 习惯 于 以 统一 费 率 上 网 的 人 刚 开始 可 能 会 觉得 
这 很 讨 居 。 如 果 内 容 消 费 最 终 会 受到 影响 ， 那 么 基于 使 用 的 定价 方案 将 
影响 “食物 链 ” 中 的 每 个 人 : 消费 者 、 网 络 供应 商 、 内 容 提供 商 、 应 用 程 
序 开 及 人 员 、 设 备 制造 商 和 广告 商 。 然 而 ， 我 们 会 看 到 有 几 个 强 有 力 的 


原因 ， 其 中 包括 有 利于 消费 者 的 原因 ， 即 支持 基于 使 用 的 定价 成 为 对 统 
一 性 率 的 自助餐 式 定 价 更 好 的 丛 代 方式 。 


智能 数据 定价 


不 管 怎样 ， 网 络 的 建设 和 运营 成 本 必须 有 人 支付。 然而， 基于 每 月 
消费 的 定价 标准 并 不 是 互联 网 服务 提供 丙 可 以 解决 这 个 问题 的 唯一 方 
式 。 


为 什么 不 提高 所 有 人 的 统一 费 率 呢 ? 有 了 足够 高 的 统一 费 率 后 ， 提 
供 商 获得 的 收入 将 足以 维持 网 络 运 行 。 然 而 ， 对 于 许多 不 消耗 大 量 数 
据 、 可 能 无 法 负担 增加 费用 的 用 户 来 说 ， 这 将 是 不 公平 的 。 或 者 限制 重 
度 用 户 的 流量 呢 ? 一 旦 消费 者 用 量 超 过 闵 值 ， 他 可 能 会 被 禁止 使 用 网 
络 。 如 果 你 对 其 他 可 能 性 感 兴趣 ， 请 参考 本 书 网 站 Q3.1 和 Q3.2 部 分 。 


或 者 ， 我 们 可 以 考虑 “更 聪明 ”的 定价 版 本 吗 ? 2010 年 中 期 以 来 ， 智 
能 数据 定价 〈 人 简称 SDP) 已 在 世界 各 地 迅速 发 展 起 来 。 智 能 数据 定价 有 
各 种 不 同 的 方法 ， 我 们 可 以 从 三 个 方面 来 考虑 。 


如 何 收费 


首先 ， 互 联网 服务 提供 商 应 该 怎样 收费 ? 正如 我 们 所 说 的 ， 基 于 使 
用 的 定价 是 现在 的 标准 模式 。 在 一 些 国家 ， 互 联网 服务 提供 商 甚至 会 因 
为 移动 数据 配额 中 的 未 使 用 部 分 而 奖励 客户 ， 或 允许 他 们 交易 那些 部 
分 。 下 一 步 是 基于 拥 赛 的 定价 ， 在 特殊 情况 下 基于 时 间 《“ 即 在 一 天 中 需 
求 较 低 的 时 间 收 费 较 少 ) 或 基于 位 置 《 即 在 需求 较 低 的 地 点 收费 较 少 ) 
来 定价 。 你 可 以 认为 ， 比 起 我 们 到 目前 所 讨论 的 基于 使 用 的 定价 方案 ， 
这 是 回 最 终 用 户 发 送 了 一 个 更 为 具体 的 反馈 信号 : 价格 变化 不 仅 基 于 每 
月 的 消费 量 ， 也 取决 于 当前 的 拥塞 状况 ， 进 而 在 更 精细 的 矿 度 下 调节 网 


络 需求 和 利用 。 


例如 ， 亚 马 进 在 其 云 服 务 中 的 现货 定价 方式 : 该 服务 的 价格 基于 当 
前 的 需求 《和 供应 ) 波动 。 另 一 个 例子 是 伦敦 的 交通 系统 : 在 工作 日 ， 
中 央 商 务 区 的 公共 交通 会 收取 较 高 澳 用 。 


器 谁 收费 


其 次 ， 互 联网 服务 提供 商 应 该 向 谁 收费 ? 除了 对 移动 数据 的 直接 消 
费 者 收费 ， 网 络 运营 商 可 能 想 向 食物 链 上 的 其 他 人 收取 费用 。 内 容 提供 
商 的 网 站 获得 点 击 率 ， 是 否 应 该 向 它们 收费 呢 ? 根据 推广 内 容 
(sponsored ”content) 计划 ， 这 些 供应 商 可 能 与 最 终 用 户 分 摊 成 
本 。Kindle 电 子 书 就 遵循 这 个 模式 。 它 有 时 也 被 运用 于 机 场 Wi-Fi 上 ， 
你 可 以 在 观看 某 个 广告 后 ， 免 费 或 以 相对 便宜 的 价格 上 网 。 此 外 ， 对 于 
允许 员 工 携带 个 人 设备 工作 的 公司 呢 ? 通过 分 割 计 费 (split 
billing) ， 员 工 的 一 部 分 移动 数据 费用 可 以 由 雇主 支付 ， 以 补偿 他 们 在 
工作 中 增加 的 使 用 量 。 


更 为 普 吉 的 是 ， 使 用 零 费 率 (zero-rating) 或 无 收费 (toll- 
free) 数据 ， 人 们 为 特定 应 用 消耗 的 数据 文 付 较 少 《或 不 文 付 ) 费用 。 
无 收费 有 两 种 形式 : 封闭 式 和 开放 式 。 想 想 脸 书 在 2015 年 提出 的 
internet.org 倡 议 一 一 让 发 展 中 国家 廉价 上 网 : 这 是 一 个 封闭 式 无 收费 的 
模式 ， 像 围墙 花园 一 般 ， 通 常 被 认为 是 与 网 络 中 立 原则 不 相 容 的 。 相 
反 ， 移 动 数据 的 1-800 号 码 则 是 开放 式 无 收费 的 例子 : 任何 人 都 可 以 赞 
助 全 部 或 部 分 移动 数据 费用 ， 而 不 只 是 那些 经 过 特定 门户 的 人 。 


对 什么 收费 


第 三 ， 互 联网 服务 提供 商 应 该 对 什么 收费 ? 当然 ， 基 本 的 方法 是 对 
效 据 使 用 收费 但 是 ， 为 什么 不 同时 基于 ， 比 如 最 终 用 户 体验 或 网 上 交 


易 来 收费 呢 ? 一 些 云 提供 商 已 经 根据 客户 所 需 的 服务 质量 (QoS 级 别 ) 
收取 费用 ， 例 如 完成 计算 任务 所 需 的 时 间 。 


通过 询问 如 何 收费 、 回 谁 收 费 以 及 对 什么 收费 ， 智 能 数据 定价 可 以 
发 出 更 有 效 的 定价 信 写 ， 实 现 更 高 效 的 共 译 。 以 无 限 方式 使 用 无 限 移动 
数据 的 日 子 已 经 一 去 不 复 返 了 : 现在 我 们 的 创新 围绕 “有 限 的 数 
气 ? 或 < 有限 的 方式 ”。 


Sr 


相对 于 统一 费 紊 ， 基 于 使 用 定价 所 具有 的 一 些 优点 我 们 已 经 探讨 
过 。 其 中 的 一 个 优点 是 ， 它 回 客 户 故 送 了 更 有 效 的 定价 信号 。 在 本 市 的 
结尾 ， 你 会 明白 其 中 的 原因 。 


我 们 首先 要 介绍 一 些 经 济 学 的 基本 概念 。 
更 高 的 数量 ， 更 高 的 效用 


假设 你 附近 有 免费 的 比萨 〈 见 图 3-8) 。 你 刚好 饿 了 ， 而 比萨 是 你 
喜欢 的 类 型 ， 你 想 拿 几 方 。 


Se 


图 3-8 
注 : 如 果 你 馈 了 ， 多 吃 几 片 比萨 会 给 你 带 来 更 多 的 “快乐 ”或 饱 腹 感 。 但 到 达 一 定 
程度 后 ， 每 增加 一 片 比萨 ， 你 的 快乐 程度 就 会 降低 一 点 儿 
你 拿 起 第 一 片 。 味 道 好 极 了 ， 同 时 它 表 定 也 使 你 的 食欲 降低 了 一 点 
儿 。 你 还 想 号 ， 所 以 你 拿 起 第 二 片 。 同 样 ， 它 的 味道 很 好 ， 令 人 满意 ， 
但 比 不 上 第 一 请 融 给 你 的 满足 感 。 在 此 之 后 ， 你 仍然 有 点 儿 饿 ， 所 以 你 
接着 号 了 第 三 请 。 它 的 味道 仍然 不 错 ， 但 你 不 那么 饿 了 ， 所 以 它 没有 带 
给 你 吃 第 一 片 或 第 二 片 那样 多 的 “好 处 ”。 


这 个 过 程 继续 下 去 《取决 于 你 可 以 吃 多 少 比 蔷 ) ， 直 到 最 终 你 无 所 
谓 再 多 吃 一 片 。 因 为 它 是 免费 的 ， 你 可 能 会 因为 它 的 味道 不 错 而 继续 
吃 ， 但 此 时 你 不 会 愿意 为 妨 一 片 付 钱 。 


这 是 一 个 人 的 效用 (utility) “〈 即 “快乐 >) 随 着 分 配给 他 们 的 资源 
量 而 改变 的 例子 。 无 论 资 源 是 食物 、 消 费 电子 产品 、 蜂 负数 据 或 其 他 什 
么 ， 重 要 的 是 根据 用 户 得 到 的 资源 量 ， 判 断 出 他 们 的 效用 是 什么 。 如 图 
3-9 所 示 ， 效 用 的 表现 普遍 具有 两 种 特性 : 


效用 


图 3-9 典型 效用 曲线 图 形 
注 : 更 多 的 数量 总 是 导致 效用 增加 ， 但 福利 的 变化 在 数量 较 多 时 减少 


。 增加 : 随 着 分 配 数 量 的 增加 ， 效 用 不 断 增 加 。 更 多 的 数据 带 
来 更 多 的 好 处 。 

。 边际 收益 递减 : 在 某 一 点 之 上 ， 效 用 开始 放 慢 增长 。 你 可 能 
把 前 几 个 GB 数 据 用 得 最 好 ， 然 后 附加 增益 开始 下 降 。 这 就 是 边际 收 
益 递减 (diminishing marginal returns) 原则 。 


更 高 的 价格 ， 更 低 的 需求 

我 们 如 何 量化 某 人 的 效用 呢 ? 一 个 稼 用 的 方法 是 观察 消费 者 对 于 该 
资源 的 表现 如 何 。 我 们 将 探讨 这 一 方法 ， 但 是 如 果 你 对 其 他 可 能 的 做 法 
感 兴趣 ， 请 参考 本 书 网 站 Q3.3 部 分 。 


每 当 有 人 进行 消费 时 ， 此 人 一 定 和 希望 他 的 净 效 用 (net utility) 尺 
可 能 高 。 这 是 他 从 购买 中 获得 的 收益 ， 也 束 是 他 的 满意 度 和 他 所 文 付 的 


金钱 之 间 的 差异 。 当 客户 以 某 一 特定 单位 价格 〈 即 10 美 元 / GB) 购买 东 
种 商品 时 ， 其 收益 为 : 


收益 = 效用 -单价 x 数量 


根据 所 谓 的 需求 (demand) ， 用 户 购 买 的 数量 又 取决 于 价格 的 高 
低 。 你 可 能 会 猜测 ， 较 高 的 价格 会 导致 较 低 的 需求 : 例如 ， 如 果 数 据 的 
价格 翻 倍 ， 你 将 消耗 更 少 的 数据 ， 而 如 果 价 格 减 半 ， 你 会 消耗 更 多 。 两 
者 的 精确 关系 通过 需求 曲线 显示 ， 这 可 以 在 现实 中 形成 复杂 的 形状 。 出 
于 我 们 的 目的 ， 我 们 将 考虑 线性 需求 ， 如 图 3-10 所 示 。 


价格 


单价 


图 3-10 线性 需求 曲线 
注 : 它 显示 如 果 卖 方 以 特定 的 单价 出 售 资源 时 ， 每 人 预计 购买 的 数量 
假设 卖方 已 经 确定 了 基于 使 用 的 价格 ， 那 么 要 找到 用 户 的 效用 和 净 
效用 会 比较 容易 。 在 图 3-11 的 图 形 中 : 


请 价 价格 


图 3-11 
注 : 根据 基于 使 用 的 定价 方案 ， 效 用 是 AtB， 支 付 的 金额 是 B， 净 效用 是 A 

。 根据 售 价 ， 我 们 可 以 在 曲线 上 得 到 用 户 的 需求 信息 。 

。 向 用 户 收取 的 总 价 等 于 单价 乘 以 数量 。 表 现 为 几何 形式 ， 这 
是 图 中 拢 形 B 的 面积 。 

。 用 户 的 效用 是 需求 曲线 左 侧 低 于 购买 数量 的 总 面积 。 换 句 话 
说 ， 它 是 三 角形 A 和 矩形 B 的 总 面积 : A + B。 

最 后 ， 我 们 可 以 通过 从 效用 中 减 去 价格 得 到 净 效 用 : 
CA+B) -B= A， 即 三 角形 A 的 面积 。 


基于 使 用 定价 下 的 消费 

关于 需求 曲线 ， 有 一 个 更 基本 的 问题 需要 回答 : 为 什么 一 开始 ， 用 
户 消耗 的 数量 就 要 被 固定 在 这 条 曲线 上 呢 ? 换 名 话说， 为 什么 无 法 激励 
人 进行 更 多 消费 ， 或 减少 购买 呢 ? 其 原因 是 ， 在 基于 使 用 的 定价 下 ， 单 


价 对 应 的 数量 将 使 用 户 的 净 效 用 最 高 。 


要 理解 这 一 点 ， 让 我 们 想 一 想 ， 当 有 人 在 需求 曲线 上 降低 或 提高 消 
费 量 时 ， 会 发 生 什 么 。 这 两 种 情况 如 图 3-12 所 示 。 在 左 侧 ， 用 户 在 需求 
曲线 上 降低 数量 : 这 会 导致 收费 (B1 部 分 的 面积 ) 减少 ， 但 同时 也 导致 
效用 (A1l+B1 的 总 面积 ) 减少 。 所 以 ， 净 效用 将 比 开始 时 下 降 A1 部 分 的 
数量 。 减 少 的 效用 大 于 减少 的 支出 。 在 右 侧 ， 用 户 在 原来 的 数量 上 增加 
消费 : 效用 上 升 了 A2， 而 收费 上 涨 A2 + B2， 导 致 净 效用 下 降 B2 部 分 的 
面积 。 增 加 的 成 本 大 于 增加 的 效用 。 
减少 数量 增加 数量 


降低 Al 部 分 效用 降低 B2 部 分 效用 


图 3-12 
注 : 解释 为 什么 在 以 使 用 为 基础 的 定价 下 ， 坚 持 需 求 曲线 符合 用 户 的 最 佳 利益 


这 就 是 为 什么 在 基于 使 用 的 计划 中 ， 根 据 需 求 曲线 进行 消费 总 是 符 
合 消 费 者 的 最 佳 利 益 。 根 据 数据 单价 计 费 ， 可 以 使 互联 网 服务 提供 商 能 
够 规范 用 户 在 移动 网 络 中 消费 数据 的 需求 。 如 果 互 联网 服务 提供 商 基 于 
操作 和 维护 网 络 的 成 本 来 设置 单价 ， 这 将 给 消费 者 发 送 有 效 的 反馈 信 
号 ， 迫 使 他 们 将 其 在 消费 时 对 网 络 施加 的 负 外 部 性 内 化 。 


统一 费 率 下 的 消费 


统一 费 率 定价 也 会 驱使 用 户 保 持 在 需求 曲线 上 吗 ? 请 记 住 ， 不 论 消 
耗 数量 多 少 ， 统 一 费 率 定价 计划 只 收取 单一 、 固 定 的 价格 。 在 这 个 计划 


下 ， 尽 可 能 多 地 获得 数据 才 符 合 客户 的 最 大 利益 ， 直 到 无 法 获得 更 多 的 
效用 。 所 以 ， 用 户 会 偏离 曲线 。 


想 想 看 : 如 果 你 每 月 只 为 数据 计划 支付 20 美 元 ， 那 什么 会 阻止 你 在 
线 播放 100 个 视频 ， 而 不 是 10 个 呢 ? 肯定 不 是 钱 。 你 会 消耗 你 每 个 月 需 
要 的 尽 可 能 多 的 数据 ， 直 到 你 不 再 需要 为 止 。 


公 地 悲剧 


要 理解 为 什么 统一 费 率 定价 对 于 网 络 来 说 并 不 合适 ， 让 我 们 来 看 看 
一 个 经 济 学 上 被 广泛 引用 的 比喻 一 一 “ 公 地 悲剧 ” (tragedy of the 
commons) ， 它 由 加 勒 特 : 哈 本 在 1968 年 提出 〈 关 于 基于 使 用 定价 方 
案 的 更 多 优点 ， 请 参考 本 书 网 站 Q3.4 部 分 ) 。 这 个 比喻 假设 一 群 牧民 共 
享 牧场 ， 他 们 都 用 其 来 饲养 自己 的 牲畜 《〈 见 图 3-13) 。 每 个 牧民 都 有 能 
力 增 加 更 多 的 牛 ， 在 土地 上 放牧 。 


图 3-13 
注 : 在 “ 公 地 悲剧 ”的 比喻 中 ， 一 群 牧民 在 一 块 共有 土地 上 饲养 牲畜 


现在 ， 假 设 牧民 鲍 勃 正 要 决定 是 否 在 牛 群 中 增加 一 头 牛 。 为 了 最 大 
限度 地 提高 个 人 收益 ， 他 想 :“ 如 果 我 再 增加 一 头 牛 ， 这 将 如 何 影 啊 我 
的 净 效 用 呢 ? ”一 方面 ， 如 果 他 增加 一 头 牛 ， 他 将 获得 出 售 这 头 牛 的 所 
有 收入 。 另 一 方面 ， 增 加 一 头 牛 将 使 土地 距离 过 度 放 牧 更 近 一 步 。 一 旦 
牲畜 太 多 ， 牧 场 将 被 耗 尽 ， 所 有 牲畜 都 会 死 。 但 是 这 项 成 本 是 由 所 有 牧 
民 平均 承担 的 ， 所 以 对 于 鲍 勃 本 人 来 说 ， 比 起 他 将 从 增加 牲畜 中 获得 的 
收益 ， 这 只 会 使 将 效用 略微 减少 。 


因此 鲍 勃 认定 ， 在 牛 群 中 增加 一 头 牛 符合 他 的 最 大 利益 。 所 以 每 次 
他 经 历 这 个 思考 过 程 后 ， 都 决定 再 加 一 头 牛 。 其 他 牧民 都 面临 同样 的 决 
定 ， 也 采取 同样 的 行动 。 


最 终结 末 是 什么 ?牧场 大 小 有 限 ， 所 以 随 着 牲 冀 越 来 越 多 ， 牧 场 将 
过 度 拥挤 和 过 度 放 牧 (图 3-14) 。 最 终 ， 将 没有 土地 可 以 放牧 。 到 那 
时 ， 所 有 牲畜 都 将 摊 饿 ， 这 对 所 有 人 来 说 都 是 最 糟 料 的 情况 。 由 于 没有 
正确 的 价格 信号 ， 鲍 动 和 其 他 牧民 集体 耗 尽 牧场 ， 酸 成 “ 莫 剧 ”。 


图 3-14 


注 : 出 于 自身 利益 ， 每 个 牧民 都 会 不 断 地 增加 牛 的 数量 。 公 地 悲剧 的 结果 是 ， 由 于 
过 度 放 牧 ， 和 草地 变 得 拥挤 不 堪 ， 最 终 被 耗 尽 

我 们 如 何 看 待 这 种 现象 ”人 在 统一 费 率 数据 计划 下 消耗 更 多 数据 的 
原因 ， 类 似 于 每 个 牧民 都 想 不 断 增加 牲畜 的 原因 。 消 费 者 每 次 从 网 络 上 
获取 数据 ， 都 不 会 产生 额外 必用 。 从 个 人 的 角度 看 ， 唯 一 的 “成 本 ”是 他 
们 增加 的 微不足道 的 拥挤 ， 所 以 获取 尽 可 能 多 的 数据 符合 他 们 的 最 佳 利 


中 继 


用 ， 


后 如 
需要 


。 但 这 最 终 可 能 导致 “ 翡 剧 ”， 由 于 所 有 人 的 巨大 需求 ， 网 络 将 被 压 
。 这 是 一 个 网 络 负 效 应 (negative network effect) 的 例子 。 


问题 在 于 ， 我 们 没有 有 效 的 定价 信号 。 额 外 的 数据 将 带 来 更 多 效 
这 很 容易 超过 一 个 人 为 在 网 络 中 增加 数据 额外 支付 的 “成 本 。 我 们 
考虑 到 ， 每 次 数据 查询 都 会 在 网 络 上 产生 负 外 部 性 ， 就 像 我 们 在 第 


1 章 看 到 的 。 手机 如 何 对 所 有 人 造成 干扰 。 在 这 种 情况 下 ， 我 们 让 用 户 
内 化 自己 的 负 外 部 性 ， 为 自己 请 求 的 每 一 部 分 数据 〈 或 在 "牧场 "上 增加 
的 每 一 头 “ 牛 ”) 支付 费用 。 更 高 的 价格 带 来 更 低 的 需求 ， 然 后 我 们 就 可 
以 从 一 开始 避免 < 翡 剧 ”。 


第 一 部 分 
MI 和 士 


/AN 二 口 


在 本 书 的 第 一 部 分 ， 依 据 “ 分 享 很 难 ”的 原则 ， 我 们 讨论 了 两 种 
网 络 : 蜂窝 和 Wi - Fi。 我 们 每 天 都 在 使 用 这 两 种 网 络 ， 但 往往 不 会 花 
太 多 时 间 去 思考 : 这 么 多 人 如 何 能 既 分 享 空 间 ， 又 不 会 破坏 彼此 的 通 
话 或 造成 容量 问题 。 我 们 看 到 远程 调节 蜂窝 语音 网 络 如 何 参 与 到 技术 
中 ， 如 通过 CDMA 实 现 分 布 式 功率 控制 ， 使 每 个 人 能 调整 自身 功率 水 
平 ， 而 不 会 引起 “军备 竞赛 ”。 与 之 相反 ， 我 们 还 看 到 ， 采 用 随机 接 
入 技术 处 理 短 距 离 、 不 受 调节 的 Wi - Fi 网 络 如 何 更 为 可 行 ， 在 这 种 情 


况 下 ， 每 个 人 都 试图 通过 感 测 和 退 避 来 避免 碰撞 。 最 后 是 移动 数据 的 
情况 ， 我 们 看 到 了 定价 如 何 成 为 实现 网 络 更 高 效 共享 的 有 效 方式 。 在 
以 上 每 种 情况 中 ， 负 反馈 对 于 确保 用 户 获得 关于 网 络 条 件 和 拥塞 的 正 
确信 号 非常 重要 。 

在 第 11 章 ,我们 将 在 讨论 如 何 设计 互联 网 时 ， 回 顾 共 享 和 定价 问 


题 。 


与 丹尼斯 -斯 特 里 格 尔 的 对 话 


丹尼斯 。 斯 特 里 格 尔 是 威 瑞 森 通信 公司 前 总 裁 兼 首席 运营 官 ， 
以 及 威 瑞 森 无 线 公司 前 总 裁 兼 首席 执行 官 。 


作者 : 非常 感谢 你 能 抽出 时 间 来 与 我 们 讨论 无 线 网 络 。 我 们 生活 的 
这 个 时 代 ， 人 们 在 每 个 清醒 的 时 刻 都 “呼吸 ”着 无 线 网 络 。 几 十 年 来 ， 你 
在 许多 公司 担任 领导 职务 ， 比 如 作为 威 瑞 牺 无 线 公 司 的 首席 执行 官 ， 并 
负责 做 出 很 多 决 倘 。 在 过 去 40 年 的 移动 通信 演变 中 ， 最 让 你 惊讶 的 部 分 
是 什么 ? 


丹尼斯 : 当 你 谈 到 40 年 时 ， 你 让 我 觉得 自己 老 了 ， 但 还 好 。 让 我 们 
从 头 说 起 。 我 记得 当 我 刚 进入 无 线 领域 时 ， 一 个 麦肯锡 公司 的 顾问 预 
计 ， 到 世纪 之 交 的 2000 年 将 有 900 ”000 个 无 线 用 户 。 现 在 ， 我 们 轻易 超 
出 这 个 数字 上 百倍 。 如 果 考 虑 到 全 球 的 用 户 ， 截 至 2014 年 年 底 ， 约 有 
3.44 亿 个 ， 所 以 该 行业 的 增长 已 经 远 远 超出 了 麦肯锡 、 贝 尔 实 验 室 和 
AT&T 早 期 的 预测 。 我 们 可 以 将 其 归 因 于 优秀 的 网 络 和 对 客户 有 用 的 好 
产品 ， 同 时 由 于 多 年 以 来 价格 不 断 下 降 ， 手 机 已 经 从 公司 高 管 察 车 后 座 
上 的 高 档 装 置 变 成 现在 的 日 党 设备， 渗透 率 ( 全 球 用 户 人 数 ) 超过 
100%， 在 2014 年 年 底 达 到 110%， 这 说 明 很 多 人 都 有 一 台 以 上 的 设备 。 


事实 上 ， 我 记得 很 久 以 前 ， 我 的 一 个 老板 对 我 说 :“ 你 去 负责 蜂 窜 
公司 吧 ， 我 知道 没有 人 想 干 这 个 。 我 向 你 保证 ， 我 只 会 让 你 在 那里 待 上 
几 年 ， 然 后 就 让 你 回来 ， 掌 管 我 们 的 一 家 大 型 电话 公司 。* 当 时 我 想 ， 
老板 让 我 干什么 我 就 干什么 。 但 它 有 点 儿 像 < 拍 拍 背 ， 帮 我 们 一 个 忙 ”， 
而 “去 干 一 段 时 间 ” 似 乎 意味 着 它 没有 前 途 。 


作者 : 过 去 几 十 年 市 场 渗透 的 规模 是 最 让 你 惊讶 的 部 分 吗 ? 


丹尼斯 : 不 仅 是 客户 数量 的 规模 ， 而 且 包 括 手 机 的 用 途 。 当 然 ， 语 
音 消息 和 话音 通话 这 些 无 线 网 络 ， 最 初 的 设计 用 途 多 年 来 一 直 成 倍增 
长 。 但 随 着 数据 的 推出 ， 数 据 业 务 也 迅速 增长 。 截 至 2008 年 (或 2009 
年 ) ， 每 年 的 短信 发 送 数 超过 一 万 亿 条 。 顺 便 说 一 下 ， 我 认为 其 中 一 半 
是 我 的 孩子 发 的 。 但 无 论 如 何 ， 我 记得 20 世 纪 90 年 代 后 期 的 短信 ， 当 时 
我 的 网 络 工作 人 员 走 过 来 对 我 说 :“ 看 看 这 个 ， 我 们 可 以 用 手机 发 送 文 
字 。?" 我 说 :“ 谁 会 愿意 这 么 做 呢 ? ”当然 ， 现 在 我 们 可 以 发 图 片 、 视 
频 ， 它 已 经 成 长 为 一 个 了 不 起 的 行业 ， 在 全 球 创 造 并 不 断 创 造 着 许 许多 
多 的 工作 机 会 。 


作者 : 是 的 ， 手 机 使 用 的 规模 和 多 样 性 都 令 人 惊讶 。 你 认为 是 什么 
在 文 持 这 种 规模 和 多 样 性 呢 ? 


丹尼斯 : 我 认为 主要 有 两 点 : 首先 是 网 络 的 质量 及 其 随 着 时 间 推 移 
的 改进 。 随 着 更 多 手机 信号 塔 建成 和 无 线 电 频谱 日 益 普及 ， 这 方面 的 服 
务 质量 也 提高 了 。 顺 便 说 一 下 ， 客 户 还 要 求 更 好 的 服务 。 我 们 知道 ， 如 
果 服 务 仍 维持 在 1984 年 、1990 年 或 者 1995 年 的 水 平 ， 我 们 将 无 法 大 大 增 
加 客户 群 。 因 此 ， 我 们 多 年 来 不 得 不 逐步 改进 服务 。 


第 二 点 来 自 定 价 。 以 前 ， 一 台 无 线 电话 设备 本 身 的 价格 约 为 3 000 
美元 。 为 了 使 其 工作 ， 汽 车 的 后 备 厢 里 还 要 放 一 台 收 发 器 。 这 项 服务 本 
号 的 价格 非常 高 ， 每 月 需要 付 50 美 元 的 基本 费 加 上 通话 一 分 钟 40~50 美 
分 的 使 用 费 ， 这 取决 于 你 打 电 话 到 哪里 ， 其 中 还 包括 没有 接听 以 及 被 挂 
断 的 电话 。 该 行业 进入 完全 竞争 时 ， 大 概 是 20 世 纪 90 年 代 中 期 ， 当 时 我 
们 有 3、4 或 5 个 竞争 对 手 ， 价 格 降 到 了 无 线 业 务 刚 推出 时 的 很 小 比例 。 


作者 : 当 你 担任 威 瑞 森 无 线 公 司 的 首席 执行 官 时 ， 在 推出 3G 和 就 
4G 做 出 决策 的 过 程 中 ， 有 很 多 不 同 的 方案 可 供 选 择 。 在 3G / 4G 音 命 期 
间 ， 你 需要 考虑 并 做 出 的 最 具 挑 战 性 的 决定 是 什么 ? 


丹尼斯 : 首先 也 是 最 重要 的 挑战 是 ， 如 何 把 一 部 分 频谱 和 系统 给 语 
首 ， 一 部 分 给 数据 ?这 个 比例 如 何 划 分 才 正 确 ? 当然 ， 一 开始 语音 业务 
比 数据 业务 多 得 多 ， 所 以 我 们 的 工程 师 需 要 在 网 络 中 增加 数据 容量 ， 
括 3G 和 4G， 但 4G 的 问题 稍微 复杂 一 点 儿 。 同 时 ， 他 们 必须 不 断 确保 ， 
数据 容量 的 增长 要 和 拥有 手机 并 使 用 这 些 数 据 的 客户 增长 保持 同步 ， 并 
成 为 网 络 的 一 部 分 。 这 就 是 工程 方面 的 一 大 挑 成 。 


我 们 在 财务 上 面临 的 巨大 挑战 是 ， 我 们 每 年 花费 近 150 亿 美元 在 建 
筑 、 厂 房 和 设备 上 。 其 中 大 部 分 投入 在 网 络 上 ， 如 手机 信和 号 塔 和 交换 
机 。 此 时 的 挑战 也 是 ， 你 应 该 把 钱 花 在 什么 地 方 ? 花 在 数据 部 分 还 是 花 
在 语音 部 分 ， 你 能 继续 保持 每 年 投入 140 亿 、150 亿 、160 亿 美元 吗 ? 收 
入 能 证 明 投 入 是 合理 的 吗 ? 财务 方面 真正 的 挑战 在 于 ， 当 时 的 情况 是 ， 
随 着 数据 使 用 量 的 增加 ， 语 音 使 用 量 正 趋 于 平稳 。 所 以 在 21 世 纪 初 ， 我 
们 看 到 的 是 ， 我 们 的 收入 中 来 自 语音 的 部 分 在 减少 ， 来 自 数据 的 部 分 在 
不 断 增长 。 但 在 当时 ， 大 多 数 的 数据 对 于 客户 来 说 是 相对 便宜 的 。 


作者 : 有 的 公司 力 推 WiMAX (全 球 互 通 微 波 存 取 ) ， 有 的 力 推 
LTE (长 期 演进 技术 ) 。 现 在 显然 ，LTE 已 在 全 球 广泛 部 署 。 威 瑞 森 无 
线 公司 是 第 一 个 部 署 LTE 的 主要 运营 商 吗 ? 


丹尼斯 : 是 的 。 在 部 车 长 期 演进 方面 ， 我 们 是 第 一 个 ， 是 的 。 


作者 : 但 十 年 前 还 不 清楚 它 的 前 景 如 何 。 关 于 这 个 决定 ， 你 有 什么 
有 趣 的 故事 吗 ? 


丹尼斯 : 嗯 ， 关 于 哪个 技术 能 最 终生 存 的 问题 ， 行 业内 总 是 有 争 
议 。WiMAX 与 LTE， 就 像 语音 业务 的 GSM 与 CDMA。 原 理 一 样 。 而 
且 ， 我 们 认为 CDMA 技 术 总 是 更 符合 成 本 效益 ， 同 时 我 们 也 认为 LTE 技 
术 更 具 成 本 效益 。 顺 便 说 一 下 (不 是 批评 WiMAX) ， 我 认为 它 是 一 个 
好 服务 ， 但 比 起 LTE， 它 肯定 不 能 以 同样 的 成 本 效益 提供 同样 的 速度 。 


作者 : 回 到 语音 与 数据 定价 。 仅 仅 几 年 前 ， 在 美国 人 们 通常 会 得 到 
无 限 的 移动 数据 ， 但 只 有 有 限 数量 的 语音 分 钟 和 短信 。 现 在 越 来 越 难 找 
到 无 限 的 移动 数据 。 我 最 近 走 进 一 家 威 瑞 森 的 商店， 发 现 一 张 海 报 上 与 
看 : 有 小 /中 /大 /超大 的 家 性 共享 数据 计划 ， 定 价 大 约 为 10 美 元 每 干 光 字 
节 。 世 界 各 地 的 许多 其 他 运营 商 切换 到 LTE 时 ， 都 开始 实行 基于 使 用 的 
定价 。 是 什么 导致 了 这 种 变化 ? 


丹尼斯 : 很 简单 ， 是 供求 关系 。 以 前 需求 量 用 使 用 时 间 表 示 。 你 使 
用 的 是 语音 分 钟 ， 你 没有 使 用 数据 分 钟 ， 因 为 它 不 存在 。 要 么 是 这 些 应 
用 不 存在 ， 或 者 还 没 建 好 ， 要 么 是 我 们 还 没 想到 它 是 多 么 的 方便 。 所 以 
从 2005 年 (或 2006 年 ) 到 现在 ， 我 们 注意 到 ， 语 音 使 用 分 钟 已 经 趋 于 平 
稳 。 现 在 我 们 看 到 的 是 ， 语 音 使 用 分 钟 下 降 ， 而 数据 使 用 (无 论 用 兆 还 
是 千 兆 来 衡量 ) 在 极 大 增加 。 因 此 ， 问 题 变 成 用 户 和 运营 商 如 何 为 网 络 
中 的 巨大 投资 支付 费用 ? 但 如 果 你 看 看 你 目前 为 每 兆 4G 数 据 文 付 的 费 
用 ， 你 会 发 现 ， 它 相 比 3G 己 大 幅 减 少 。 


作者 : 人 们 也 开始 探索 各 种 更 聪明 的 方式 来 为 数据 定价 ， 包 括 如 基 
于 网 络 条 件 或 不 同形 式 的 赞助 数据 进行 动态 定价 。 有 企业 推出 了 开放 的 
无 计 费 服务 ， 它 也 被 称 为 移动 数据 的 1-800 写 码 。 关 于 这 些 和 其 他 使 移 
动 数 据 的 需求 和 供应 相 匹 配 的 想法 ， 你 认为 定价 革命 将 走向 何 处 ? 


丹尼斯 : 好 吧 ， 让 我 先 补充 说 明 一 下 。 通 常情 况 下 ， 当 你 进行 免费 
访问 时 ， 会 有 某 种 隐形 成 本 。 你 经 常 需要 看 一 则 广告 ， 或 者 看 到 持续 不 
断 的 弹 窗 广 告 ， 这 可 能 会 车 恼 你 ， 扰 乱 你 的 思路 ， 所 以 这 是 一 种 平衡 行 
为 。 


那么 ， 我 们 将 走 同 何 处 呢 ? 我 可 以 保证 的 一 点 是 使 用 单价 将 继续 降 
低 ， 因 为 随 着 使 用 增长 ， 消 费 者 和 商业 应 用 增长 ， 运 营 商 的 收入 增长 ， 
制造 商 和 运营 商 的 成 本 将 持续 下 降 。 


作者 : 最 近 有 很 多 关于 物 联网 、 我 的 互联 网 和 一 切 事物 的 互联 网 的 


议论 ， 你 甚至 可 以 在 黄金 时 段 的 广告 中 看 到 。 我 们 谈论 的 是 网 络 设备 ， 
它们 存在 于 我 们 体内 、 体 表 、 里 体 周围 ， 或 城市 、 工 业 和 农业 环境 中 
等 。 我 们 在 哪里 可 以 找到 第 一 批 主 要 行业 部 门 ， 使 其 实现 飞跃 式 发 展 ， 
并 带 来 最 直接 的 价值 呢 ? 


丹尼斯 : 我 完全 同意 你 对 物 联网 的 看 法 。 正 如 许多 人 上 所 说 ， 我 们 有 
微小 的 机 器 ， 能 以 茶 种 方式 、 性 质 或 形式 控制 我 们 的 生活 。 在 几乎 所 有 
可 能 的 方面 ， 无 论 它 们 是 否 控制 我 们 的 城市 以 及 电力 和 照明 的 使 用 ， 例 
如 水 资源 和 公用 事业 ， 或 者 是 否 在 运输 业 看 到 它 ， 这 可 能 是 你 的 问题 ， 
我 们 会 看 到 它 的 第 一 个 地 方 ， 不 一 定 只 是 智能 汽车 ， 还 有 智能 高 速 公 
路 ， 你 已 经 开始 看 到 了 。 


至 于 为 什么 物 联网 在 内 部 垂直 领域 友 展 迅速 ， 原 因 之 一 是 它 不 仅 方 
便 快捷 ， 还 降低 了 提供 给 它 的 人 力 成 本 ， 所 以 我 认为 我 们 将 看 到 更 多 的 
物 联 网 。 而 且 我 认为 那 不 局 限于 特定 的 垂直 领域 。 


作者 : 比如 说 交通 ,我们 看 到 云 服 务 下 降 到 最 终 用 户 或 接近 用 户 的 
边缘 设备 中 ， 形 成 一 张 “ 筋 网 ?>。 人 们 看 到 这 个 情况 ， 想 知道 由 于 这 些 网 
络 设备 的 物理 距离 接近 ， 现 在 可 以 实现 什么 样 的 应 用 。 与 此 同时 ， 人 们 
也 在 关注 安全 和 隐私 问题 。 如 果 你 看 食物 链 上 不 同 部 分 的 苋 争 利益 ， 会 
发 现 每 个 人 都 想 成 为 拥有 者 。 苹 果 公 司 和 三 星 公司 想 说 手机 是 这 张 穷 网 
的 中 心 ， 而 思科 公司 想 说 ， 它 们 正在 与 汽车 公司 合作 研发 的 仪表 板 是 中 
心 。 


丹尼斯 : 或 者 是 路 由 器 ， 或 者 是 交换 机 ， 或 者 .…… 


作者 : 或 者 威 瑞 森 公 司 会 说 ， 你 劳 边 那个 我 控制 的 小 基站 是 中 心 。 
那么 ， 对 于 网 络 运营 商 来 说 ， 什 么 是 一 个 好 的 策略 ， 这 个 中 心 最 终 可 能 
会 在 哪里 ? 


丹尼斯 : 嗯 ， 我 在 电信 行业 的 同行 不 会 喜欢 我 的 说 法 ， 但 我 认为 以 


当前 的 进程 和 速度 ， 这 个 中 心 最 终 将 是 你 的 设备 ， 在 你 的 口袋 、 钱 包 和 
你 旁边 的 车 里 。 没 有 它 ， 你 就 不 会 离开 家 。 它 儿 乎 无 时 无 刻 不 在 你 丑 

上 上。 那么 运营 商 如 何 与 之 苋 搜 呢 ? 我 不 确定 。 但 我 认为 对 于 运营 商 来 

说 ， 管 梁 在 于 合作 ， 无 论 与 苹果 、 谷 歌 ， 还 是 和 思科 等 公司 合作 ， 其 至 
征 和 制造 商 ， 比 如 爱立信 、 详 基 亚 合作 。 那 些 拥 有 客户 和 拥有 设备 扩 术 
的 人 ， 必 须 走 到 一 起 。 


威 瑞 森 公 司 今天 有 个 很 大 的 优势 。 它 有 超过 1 亿 个 客户 。 现 在 ， 谷 
歌 可 能 会 说 自己 有 这 么 多 的 搜索 服务 使 用 者 ， 但 不 能 说 自己 有 这 么 多 客 
尸 。 现 在 ， 我 有 一 台 苹 果 手 机 ， 但 我 的 苹果 手机 是 连接 到 威 瑞 森 无 线 网 
络 的 。 谁 为 此 向 我 收费 呢 ?” 苹 果 公 司 也 许 会 收 一 次 费 ， 但 威 瑞 森 无 线 每 
个 月 都 收费 。 因 此 ， 在 这 个 等 式 的 两 边 ， 双 方 会 以 某 种 方式 、 性 质 或 形 
式 争 竺 客户， 同时 它们 也 成 为 伙伴 走 到 一 起 。 我 们 正 处 于 这 一 切 的 开 


端 。 


作者 : 我 还 有 最 后 一 个 问题 ， 也 许 与 国家 政策 有 关 ， 也 受到 我 们 刚 
刚 谈 到 的 这 些 应 用 和 需求 的 驱使 。 美 国联 邦 通讯 委员 会 宣布 ， 类 国 在 
2014 年 正式 陷入 频谱 亦 字 。 我 们 的 频谱 用 完了 吗 ? 如 果 是 这 样 ， 我 们 在 
频 详 短缺 的 未 来 该 如 何 生活 ? 


丹尼斯 : 我 一 个 字 也 不 相信 。 无 论 是 在 美国 还 是 在 全 世界 ， 都 不 存 
在 频谱 短缺 的 问题 。 事 实 是 ， 目 前 已 有 的 频谱 比美 国 公司 能 使 用 的 更 
多 。 面 临 的 挑战 是 ， 它 在 错误 的 人 手中 。 它 在 政府 和 政府 机 构 手 中 ， 它 
们 不 愿意 在 任何 情况 下 放弃 频谱 。 它 们 对 频谱 的 使 用 非常 低 效 ， 而 且 政 
府 必 须 认 识 到 ， 它 们 对 使 用 频谱 的 部 署 效率 必须 和 商业 部 署 的 效率 一 样 
高 。 如 果 乞 们 这 样 做 ， 就 不 会 看 到 频谱 短缺 。 


作者 : 所 以 你 认为 问题 的 核心 是 使 用 效率 ， 而 不 是 频谱 本 映 的 短 
缺 ? 


丹尼斯 : 在 政府 中 有 很 多 人 会 和 我 争论 这 个 ， 但 我 已 经 担任 这 个 职 


位 很 多 年 了 ， 而 且 相 比 已 经 使 用 的 频谱 量 ， 己 经 被 担 卖 挥 、 用 于 商业 目 
的 的 频 详 量 微不足道 。 顺 便 说 一 下 ， 广 播 公司 使 用 频谱 的 效率 也 不 高 ， 
所 以 效率 问题 就 在 于 此 。 


作者 : 非常 感谢 你 ， 和 丹 尼 。 这 是 一 次 非常 有 局 发 性 的 谈话 ， 谢 谢 你 
分 享 你 的 观点 。 不 管 未 来 怎样 ， 都 会 同样 精彩 。 


第 二 部 分 


排序 很 难 


在 第 一 部 分 ， 我 们 看 到 了 在 多 个 用 户 之 间 有 效 地 划分 共享 资源 是 
多 么 的 具有 挑战 性 。 现 在 ， 在 第 二 部 分 ， 我 们 把 注意 力 转向 网 络 中 的 
另 一 个 挑战 : 如 何 找到 一 组 项 目的 合适 排序 。 我 们 特别 关注 谷歌 使 用 
的 排序 方法 : 不 断 更 新 网 页 向 网 站 的 每 个 访问 者 显示 的 顺序 。 事 实 
上 ， 谷 歌 有 两 种 不 同 “ 类 型 ”的 页 面 : 占据 广告 空间 的 页 面 以 及 显示 


为 搜索 结果 部 分 的 页 面 。 我 们 将 分 别 在 第 4 章 和 第 5 章 讨论 这 两 个 主 

题 。 正 如 你 将 看 到 的 ， 完 全 不 同 的 技术 可 用 于 项 目 排序 ， 广 告 空间 基 
于 竞价 被 分 配给 购买 者 ， 而 搜索 结果 会 根据 重要 性 和 相关 性 进行 排 

序 。 


第 4 章 
苋 标 广告 空间 


如 果 你 在 过 去 10 年 中 上 过 网 ， 你 就 一 定 用 过 谷歌 搜索 引擎 〈 见 图 4- 
) 。 我 们 “谷歌 "一切 一 一 从 寻找 最 近 的 咖啡 店 到 搜索 大 学 课程 的 详细 
解答 。2006 年 ，“ 谷 歌 搜索 ”作为 一 个 词 被 收录 到 《牛津 瑞 语 字典 》 中 。 
一 大 部 分 读者 可 能 一 开始 也 是 由 谷歌 介绍 而 选择 本 书 的 。 


Google 


图 4-1 无 处 不 在 的 谷歌 标志 性 商标 
谷歌 拥有 超过 55 “000 名 员工 ，2014 年 的 收入 为 660 亿 美元 ， 比 上 一 
年 增长 19%。 那 么 谷歌 是 如 何 对 网 页 进行 排序 的 ? 它 又 是 如 何 从 其 广告 
业务 中 赚钱 的 ? 


在 线 广告 业务 


麦 格 纳 环球 公司 估计 ，2015 年 全 球 在 线 广告 行业 创造 的 收入 超过 1 
600 亿 美元 。 其 中 ，2014 年 谷歌 仅 从 广告 就 获得 近 90% 的 收入 ， 只 有 大 
约 10% 的 收入 来 自 其 他 业务 ， 如 谷歌 游戏 、 谷 歌 应 用 程序 和 谷歌 光纤 ， 
如 图 4-2 所 示 。 这 些 广告 是 如 何 运 行 的 ? 


10.5% 


图 4-2 谷歌 2014 年 的 大 致 收入 来 源 
注 : 约 68% 来 自 谷 歌 自 己 网 站 上 的 广告 ， 还 有 约 21% 来 自 合作 伙伴 网 站 上 的 广告 。 只 
有 约 11% 来 自 广 告 以 外 的 业务 ， 虽 然 这 些 来 源 每 年 所 占 的 比例 在 逐渐 上 升 


如 何 计 费 ? 


在 线 广 告 的 起 源 可 以 追溯 到 互联 网 时 代 早 期 (20 世纪 90 年 代 中 
期 ) 。 显 示 广 告 的 页 旗 最 初 由 网 站 〈 即 卖家 ) 基于 每 干 次 印象 (pay- 
per-thousand-impressions) 出 售 给 广告 客户 〈 即 买 家 ) 。 这 意味 
着 ， 每 当 买 方 的 页 旗 累 积 到 1 000 个 新 的 访问 ， 广 告 客户 就 将 支付 给 卖 
方 预先 确定 的 金额 。 


这 真 的 是 同 广 告 商 收费 的 最 佳 方式 吗 ? 当然 ， 看 到 一 则 广告 并 不 能 
保证 人 们 会 点 击 它 ， 更 不 用 说 让 他 们 从 上 面 买 东西 。 因 此 ， 这 种 方法 只 
能 在 一 定 程度 上 表明 ， 发 布 广告 会 给 广告 客户 带 来 多 少 利益 。 


那么 如 果 根 据点 击 计 费 ， 而 不 是 访问 呢 ?1998 年 ， 搜 索引 苟 公司 
GoTo 开 始 提供 这 种 选择 。 在 该 模式 中 ， 广 告 客户 提交 竞拍 出 价 ， 以 决 
定 他 们 愿意 支付 多 少 费用 来 出 现在 搜索 结果 页 面 的 顶部 (在 特定 的 搜索 
查询 中 ) 。 这 些 报价 基于 点 击 付费 (pay-per-click) : 每 次 有 人 点 击 


GoTo 页 面 的 链接 ， 跳 转 到 它们 的 网 站 上 ， 广 告 商 就 会 支付 它们 的 出 价 
金额 。GoTo 提 供 的 搜索 结果 列表 按照 点 击 支 付出 价 金 额 降序 排列 ， 如 
图 4-3 所 示 。 


游 
济 
B30 
时 


本 的 面包 房 


来 买 这 一 市 最 好 的 烘焙 食品 。 “3 美元 


马 特 的 市 场 
70 个 评论 :“ 哇 。 这 是 一 个 
幸运 的 周边 发 现 。” 


< 一 > 3 美元 


加 比 的 杂货 店 
是 的 ， 我们 今天 营业 ! 来 锋 
和 逛 这 一 带 最 棒 的 杂货 店 。 


< 一 > ] 美元 


图 4-3 搜索 结果 页 面 的 一 个 小 例子 
注 : 查询 词 是 “食品 店 ”， 所 以 出 现 的 链接 与 食品 购买 有 关 。 广 告 顺序 根据 广告 商 
为 第 一 个 位 置 出 价 多 少 排列 。 本 的 面包 房 出 价 最 高 ， 为 5 美元 ， 其 次 是 马 特 的 市 场 
(3 美元 ) 和 加 比 的 杂货 店 (1 美元 ) 。 因 此 ， 每 当 有 人 点 击 他 们 的 链接 ， 这 些 商店 
将 分 别 支 付 5 美 元 、3 美 元 和 1 美元 


GoTo 创 造 了 所 谓 的 赞助 商 搜索 模式 ， 这 种 模式 也 被 称 为 搜索 广告 
(search ads) 。GoTo 于 2001 年 改名 为 Overture， 并 在 2003 年 被 雅虎 收 


购 ， 雅 虎 开 始 以 它 发 展 搜索 营销 服务 。 在 世纪 之 交 时 ， 男 一 家 搜索 引擎 
公司 谷歌 也 已 经 开始 普遍 使 用 扣 击 付费 广告 模式 。 谷 歌 公 司 成 并 于 1998 
年 ， 并 在 2000 年 建 六 了 AdWords 部 门 ， 人 负 员 公司 的 广告 业务 。 在 当时 ， 
AdWords 开 始 提 供 关 键 词 广 告 服务 ， 根 据点 击 付费 定价 ， 这 成 为 谷歌 搜 
索引 擎 的 特点 。 


目 那 时 以 来 ， 谷 歌 已 成 为 运 今 为 止 最 大 的 搜索 广告 提供 两。 根据 
eMarketer 的 数据 ， 谷 歌 在 2014 年 拥有 55% 的 市 场 份额 。 百 度 是 该 行业 中 
的 第 二 大 公司 ， 其 市 场 份额 不 足 8%。 我 们 现在 具体 看 看 AdWords。 


佳 握 六 各 


假设 你 想 通 过 谷歌 搜索 为 你 的 网 站 做 广告 。 通 过 AdWords， 你 可 以 
输入 要 显示 的 内 容 ， 包 括 你 的 网 站 链接 和 一 些 描述 性 文字 ， 并 为 广告 设 
置 一 些 关 键 词 。 这 些 信息 将 被 发 送 到 谷歌 的 数据 库 ， 广 告 将 被 创建 ， 当 
有 人 在 谷歌 搜索 栏 中 进行 查询 ， 并 且 包含 和 广告 相关 的 文字 ， 你 的 广告 
就 可 能 会 出 现在 搜索 结果 中 。 


当 一 个 关键 词 〈 或 一 组 关键 词 ) 被 输入 到 谷歌 搜索 栏 时 ， 你 可 能 会 
注意 到 ， 谷 歌 实际 上 显示 了 两 样 东西 : 一 个 是 搜索 结果 的 标准 列表 ， 羽 
一 个 是 与 查询 关键 词 匹配 的 广告 列表 。 你 可 以 在 图 4-4 中 看 到 一 个 包含 
这 两 种 类 型 结果 的 典型 搜索 布局 (截至 2015 年 ) 。 标 准 搜索 结果 显示 在 
页 面 的 中 间 ， 而 赞助 广告 则 显示 在 页 面 的 边缘 : 顶部 、 石 侧面 板 或 底 


部 。 


图 4-4 
注 : 在 谷歌 搜索 页 面 中 (2015 年 ) ， 标 准 搜索 结果 《〈 左 图 ) 通常 显示 在 页 面 的 中 
间 ， 而 赞助 广告 〈 右 图 ) 则 显示 在 页 面 的 边缘 

试 试 输入 些 内 容 到 谷歌 搜索 栏 。 作 为 范例 ， 我 们 于 2015 年 6 月 输 

入 “在 线 教 育 ”〈 顺 便 说 一 句 ， 我 们 将 在 第 8 章 对 其 进行 讨论 ) 。 除 了 显 
示 10~15 个 链接 到 某 些 在 线 项 目 和 排行 的 标准 搜索 结果 ， 谷 歌 还 基于 关 
键 词 ， 在 顶部 和 右 侧 面板 显示 广告 。 顶 部 的 第 一 个 广告 是 凤凰 城 大 学 
(www.phoenix.edu/Education? “ ) 。 这 个 位 置 和 右面 板 顶 部 的 位 置 估计 
会 获得 最 多 的 点 击 量 ， 是 你 的 广告 出 现 的 理想 位 置 。 


你 的 广告 会 被 放 在 列表 中 的 哪个 位 置 ， 取 决 于 你 愿意 支付 多 少 赞助 
以 及 竞价 分 配 结 末 。 在 竞价 中 ， 你 和 其 他 选择 这 些 关 键 词 的 人 就 是 
者 。 在 苋 价 结束 时 ， 出 价 最 高 的 人 将 得 到 最 好 的 位 置 ， 出 价 第 二 高 
的 得 到 第 二 好 的 位 置 ， 以 此 类 推 。 我 们 将 在 本 章 介绍 不 同 的 竞价 机 制 。 


有 
< 一 > 


“ 告 商 什么 时 候 向 谷歌 付费 ”通过 点 击 付费 ， 每 次 有 人 点 击 广告 ， 
谷歌 都 会 得 到 报酬 。 一 个 广告 位 置 在 比如 1 小 时 内 被 访问 者 点 击 的 平均 
次 数 称 为 点 击 率 (click-through rate) 。 广 告 商 向 谷歌 支付 的 费用 与 
广告 的 点 击 率 成 正比 ， 因 为 点 击 率 体现 谷歌 提供 的 价值 〈 见 图 4-5) 。 


_\/ ” 忆 击 


图 4-5 
注 : 广告 位 置 的 点 击 率 可 以 衡量 一 段 时 间 内 预期 的 访问 次 数 ， 是 广告 客户 竞价 时 的 
重要 考虑 因素 
告 商 能 从 中 得 到 什么 ? 它们 可 以 预计 从 广告 的 每 次 点 击 中 获得 的 
平均 收入 。 根 据 产 品 的 点 击 率 《〈 每 小 时 点 击 次 数 ) 和 每 次 点 击 的 收入 ， 
告 客户 能 预计 从 某 个 广告 位 置 获得 的 收入 ， 这 是 广告 位 置 对 于 买 家 的 
估 值 (valuation) 。 每 个 广告 客户 将 对 各 个 位 置 有 不 同 的 估 值 。 


例如 ， 假 设 一 个 广告 位 置 每 小 时 获得 20 次 点 击 ， 并 且 每 次 点 击 后 ， 
访问 者 都 有 50% 的 概率 会 购买 一 个 了 商品。 如果 商品 的 平均 售 价 为 70 美 
元 ， 这 个 位 置 对 于 三 A 其 预期 收入 为 : 


上 击 
， 
加 水 用 0 二 去 -站 和 ,两 妆 ,一 0 中 


公开 苋 价 


正如 我 们 所 说 ， 谷 歌 通过 广告 竞价 (auctions) 向 买 家 出 售 广告 


空间 。 在 一 般 情 况 下 ， 一 次 竞价 有 不 同 竞 价 人 、 项 目 和 卖家 ， 但 我 们 只 
关注 单一 卖方 的 情况 ， 因 为 谷歌 是 这 里 的 单一 卖方 。 


尽管 拍卖 手段 的 普及 ， 在 很 大 程度 上 得 益 于 互联 网 的 兴起 ， 但 在 谷 
歌 时 代 之 前 的 几 个 世纪 ， 拍 卖 就 已 经 被 用 来 作为 商品 交易 的 一 种 手段 。 
历史 上 ， 从 马 和 牲畜 到 房地产 和 整个 帝国 ， 都 曾 被 作为 拍卖 标的 物 放 到 
拍卖 台 上 。 最 早 的 拍卖 可 以 追溯 到 公元 前 500 年 。 一 个 (相对 较 近 的 ) 
例子 是 ， 在 美国 南北 战争 期 间 (1861 一 1865 年 ) ， 被 军队 缴获 的 商品 通 
过 当地 指挥 上 校 拍卖 出 售 。 因 此 ， 今 天 美国 的 一 些 拍卖 商 被 称 为 “上 


校 ” 


提 到 拍卖 ， 你 可 能 会 想到 一 个 公共 场所 ， 里 面 有 一 个 拍卖 人 和 多 个 
投标 人 ， 如 图 4-6 所 示 。 拍 卖 人 站 在 被 拍卖 物品 的 旁边 ， 协 调 拍卖 过 
程 ， 被 一 群 竞拍 者 包围 。 
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图 4-6 传统 、 开 放 、 公 开 的 拍卖 厅 


这 种 拍卖 中 每 个 人 的 出 价 都 被 公开 宣布 ， 称 为 公开 拍卖 (open 
auction) 。 公 开拍 卖 有 两 种 主要 类 型 : 增 价 和 降价 。 在 增 价 拍卖 


(ascending price auction) 中 ， 拍 卖 人 首先 宣布 标底 ， 然 后 任何 投 
标 人 都 可 以 举 手 并 提出 更 高 的 价格 。 拍 卖 人 可 能 会 说 : “拍卖 从 10 美 元 

开始 ! 有 出 10 美 元 的 人 吗 ? ”然后 有 人 举 起 手 说 :“ 我 们 出 10 美 元 ， 有 人 
超过 10 美 元 吗 ?” 然 后 有 人 出 20 美 元 ， 以 此 类 推 ， 直 到 没有 人 出 更 高 的 

价 。“100 美 元 一 次 ， 两 次 ， 成 交 ! ”最 后 一 个 投标 人 获得 该 物品 ， 并 文 

付 其 最 新 的 出 价 。 


增 价 拍卖 是 我 们 最 熟悉 的 拍卖 方式 。 相 比 之 下 ， 在 降价 拍卖 
(descending price auction) 中 ， 拍 卖 人 首先 宣布 一 个 高 价格 ， 高 
到 没有 人 会 接受 。 然 后 拍卖 人 逐渐 降低 价格 ， 直 到 有 一 个 投标 人 
喊 :“ 买 ! ”该 投标 人 会 获得 该 物品 ， 并 支付 拍卖 终止 时 的 价格 。 


公开 担 卖 使 用 得 相当 频 系 ， 但 谷歌 等 搜索 广告 赞助 商 不 用 这 种 方 
式 。 与 公开 竞拍 相对 的 是 私下 提交 的 投标 ， 被 称 为 密封 (sealed- 
envelope) 拍卖 ， 它 在 许多 场合 中 更 为 实际 。 接 下 来 我 们 将 对 其 进行 
具体 讨论 。 


密封 拍卖 


谷歌 使 用 特定 类 型 的 密封 拍卖 将 广告 位 置 分 配给 投标 人 。 在 考虑 多 
个 项 目 〈 例 如 多 个 广告 位 置 ) 之 前 ， 让 我 们 移 看 看 单一 项 目的 担 卖 。 


在 密封 拍 立 中 ， 每 个 投标 人 私下 提交 投标 ， 所 有 投标 同时 问 拍 卖 人 
显示 《〈 见 图 4-7) 。 然 后 ， 担 夹 人 决定 如 何 匹配 (matching) 〈 即 分 
配 ) 和 收费 。 匹 配 部 分 很 容易 : 出 价 最 高 者 得 到 拍卖 品 。 但 收取 的 金额 
会 有 所 不 同 ， 这 取决 于 它 是 什么 类 型 的 密封 拍卖 : 


投标 人 A 


Bx 


投标 人 B 
= 
投标 人 C 竟 价 C 全 拍卖 人 


投标 人 DD 


图 4-7 
注 : 在 密封 拍卖 中 ， 每 个 投标 人 《A、B、C……) 向 拍卖 人 私下 提交 竞价 。 拍 卖 结果 
是 明确 的 : 拍卖 品 将 由 出 价 最 高 的 人 获得 。 决 定 出 价 多 少 更 为 复杂 
。 在 第 一 价格 拍卖 (first-price auction) 中 ， 获 胜 者 支付 自 
己 给 出 的 最 高 出 价 。 
在 第 二 价格 拍卖 (second-price auction) 中 ， 获 胜 者 支 
付 第 二 高 的 出 价 。 


你 可 以 在 图 4-8 中 看 到 两 种 拍卖 的 兰 异 。 山 特 获得 吉他 ， 最 高 出 价 
为 800 半 元。 根据 第 一 价格 ， 她 将 文 付 目 己 的 出 价 800 美 元 。 根 据 第 二 价 
格 ， 她 将 支付 第 二 高 出 价 〈 克 里 斯 的 ) 750 美 元 。 


750 美 元 获胜 者 : 凯特 


第 一 价格 800 美 元 
第 二 价格 750 美 元 


图 4-8 


注 : 第 一 和 第 二 价格 密封 拍卖 的 区 别 在 于 ， 获 胜 者 支付 多 少 金 额 


为 什么 有 人 会 使 用 第 二 价格 拍卖 呢 ? 千 一 看 ， 这 似乎 不 对 荔 儿 。 如 


果 我 想 要 一 件 担 卖 品 ， 


出 一 个 非常 高 的 金额 ， 远 高 于 我 目 身 对 该 担 卖 品 的 佑 值 呢 ? 


同时 我 知道 启 家 将 文 付 第 二 高 出 价 ， 为 什么 不 提 


事实 证 明 ， 这 种 直 沉 实际 上 是 错误 的 。 原 因 很 简单 : 如 果 每 个 人 都 


采取 同样 的 思维 ， 那 么 “第 二 高 出 价 ” 也 将 是 非常 高 的 。 因 此 ， 获 胜 者 将 
为 担 卖 品 文 付 比 其 目 身 估 值 高 得 多 的 金额 。 了 解 到 这 一 点 ， 每 个 人 就 不 
会 提出 比 其 趴 正 估 值 更 高 的 竞价 ， 以 避免 支付 费用 超过 担 卖 品 价值 。 下 


面 我 们 对 此 进行 详细 讨论 。 


第 二 价格 是 合理 的 


归根 结 底 ， 投 标 人 参加 拍卖 的 目标 是 使 其 回报 (payoff) 最 大 


化 ， 也 就 是 他 获得 的 净 收 益 。 如 果 投 标 人 局 得 拍卖 品 ， 其 回报 是 他 的 佑 
值 和 文 付 价格 之 间 的 差异 : 


回报 = 估 值 -支付 价格 


然而 ， 如 宁 他 没有 成 功 ， 回 报 融 是 零 。 回 报 实际 上 证 净 效 用 的 一 种 
特殊 情况 ， 我 们 曾 在 第 3 章 中 讨论 过 。 


回报 会 是 负数 吗 ? 当然 。 文 付 价 格 可 能 比 佑 值 更 高 。 这 是 投标 人 总 
想 避 人 免 的 情况 ， 因 为 在 这 种 情况 下 ， 他 宁愿 不 要 该 拍 买 品 。 


投标 人 如 何 最 大 限度 地 提高 自己 的 回报 ? 这 取决 于 拍卖 的 类 型 。 首 
先 考 虑 第 一 价格 密封 担 卖 的 情况 。 在 这 种 情况 下 ， 启 家 的 回报 是 什么 ? 
由 于 他 为 拍卖 品 支 付 的 价格 是 他 上 自己 的 出 价 ， 因 此 他 的 回报 是 其 对 拍卖 
品 的 估 值 减 去 出 价 。 一 般 来 说 ， 和 人们 很 难 决定 应 该 出 价 多 少 ， 以 争取 回 
报 最 大 化 ， 因 为 他 们 是 否 获 胜 取 决 于 其 他 人 的 集 略 。 但 有 一 点 是 明确 
的 : 在 这 种 类 型 的 拍卖 中 ， 每 个 人 的 出 价 应 该 总 是 低 于 其 个 人 估 值 ， 因 
为 如 果 不 这 样 ， 启 得 拍卖 品 只 能 带 来 非 正 面 的 回报 〈 即 为 零 或 小 于 


零 ) 。 


第 二 价格 担 卖 的 情况 如 何 ? 在 这 种 情况 下 ， 获 胜 者 将 文 付 第 二 高 出 
价 ， 所 以 他 的 回报 是 其 估 值 减 去 这 个 数字 。 这 种 拍卖 方式 鼓励 诚实 的 投 
标 (truthful bidding) ， 意 味 着 对 于 每 个 人 来 说 ， 了 最 好 的 策略 就 是 在 
出 价 时 提交 真实 估 值 。 

为 什么 ?因为 改变 出 价 不 能 提高 回报 。 这 个 道理 类 似 于 为 什么 基于 
使 用 的 定价 勤 励 用 户 基 于 需求 曲线 进行 消费 ， 正 如 我 们 在 第 3 半 中 看 到 
的 那样 。 


要 理解 这 一 点 ， 可 以 假设 你 在 竞拍 一 件 物品 ， 你 对 其 真正 的 佑 值 是 
50 半 元。 你 考虑 提交 真实 估 值 作为 你 的 出 价 ， 但 还 有 两 个 选择 提高 或 


降低 出 价 ， 如 图 4-9 所 示 。 首 先 ， 如 果 你 决定 降低 出 价 ， 比 如 说 降 到 45 
美元 ， 你 的 回报 会 怎么 样 ? 在 第 二 价格 担 夹 中 ， 能 改变 结果 的 唯一 办 法 
是 ， 如 果 你 本 来 要 局 ， 然 后 你 把 价格 降 到 足够 低 ， 让 第 二 高 出 价 者 最 得 
该 拍卖 品 。 也 许 此 人 出 价 为 48 美 元 。 本 来 ， 你 的 回报 应 为 正 : 你 要 付 第 
二 高 出 价 48 美 元 ， 你 的 回报 为 50 美 元 - 48 美 元 = 2 美元 。 但 现在 你 输 挥 了 
拍卖 ， 你 的 回报 是 零 ! 你 本 应 该 提交 真实 的 佑 值 ， 因 为 正 回报 比 零 回 报 


要 好 。 


新 赢家 


图 4-9 

注 : 在 第 二 价格 密封 拍卖 中 ， 如 实 出 价 符合 你 的 最 佳 利 益 。 提 高 或 降低 出 价 只 会 减 
少 你 的 回报 

另 一 方面 ， 如 果 你 把 出 价 提 高 到 55 半 元， 会 发 生 什 么 呢 ? 能 改变 结 
果 的 唯一 方法 是 ， 如 果 你 本 来 要 输 掉 拍 卖 ， 但 你 将 出 价 提 到 足够 高 ， 使 
你 胜出 ， 导 致 以 前 出 价 最 高 的 投标 人 失败 。 假 设 这 个 人 出 价 53 美 元 。 本 
来 ， 你 的 回报 为 零 。 现 在 ， 你 赢得 了 这 件 物品 ， 并 文 付 53 美 元 ， 这 意味 
着 你 的 回报 是 50 美 元 - 53 美 元 = -3 美元 。 此 值 为 负 值 ， 因 为 你 的 估 值 低 
于 第 二 高 出 价 。 在 这 种 情况 下 ， 你 也 应 该 提交 你 的 真实 估 值 ， 因 为 零 回 
报 比 负 回 报 好 。 


因此 ， 第 二 价格 拍卖 比 第 一 价格 拍卖 “更 好 >， 原因 在 于 ， 它 使 如 实 
出 价 符合 每 个 人 的 最 佳 利益 。 买 家 思考 应 该 如 何 出 价 时 ， 有 一 个 隐蔽 的 
反 饿 信号， 或 励 其 将 出 价 设 为 其 目 身 的 估 值 。 切 断 获 胜 者 人 选 和 顾家 文 
付 价格 之 间 的 联系 是 有 用 的 。 


第 二 价格 比 诸如 第 三 、 第 四 或 第 五 价格 拍卖 的 情况 好 吗 ? 事实 证 
明 ， 只 有 第 二 价格 才能 使 每 个 使 用 者 控制 自己 对 网 络 施加 的 负 外 部 性 : 
如 果 不 考 虑 拍卖 的 赢家 ， 那么 第 二 高 出 价 者 将 胜出 。 这 样 ， 赢 家 获胜 是 
因为 出 价 第 三 高 的 投标 人 没有 获胜 ， 因 为 获胜 者 的 支付 金额 是 第 二 高 的 
出 入 


正如 第 1 章 的 分 布 式 功率 控制 和 第 3 章 的 基于 使 用 的 数据 定价 ， 第 二 
价格 拍卖 同样 说 明 ， 通 过 向 用 户 发 送 关 于 其 影响 的 信号 ， 迫 使 其 内 化 自 
己 的 负 外 部 性 ， 在 网 络 中 是 一 个 常见 的 主题 。 


` 些 意 想 不 到 的 联系 


在 图 4-10 中 ， 你 可 以 看 到 我 们 讨论 过 的 单一 项 目 拍 卖 的 分 类 示意 
图 。 它 们 之 间 有 一 些 有 趣 的 相似 之 处 。 弟 先 ， 考 虑 增 价 公 开 操 卖 。 当 出 
价 提高 时 ， 所 有 投标 者 心中 都 有 自己 的 估 值 ， 每 个 人 部 将 继续 竞拍， 直 
到 出 价 高 于 其 估 值 。 当 前 出 价 会 不 断 上 升 ， 直 到 售 值 第 二 高 的 投标 人 选 
择 放 弃 。 所 以 ， 除 非 启 家 大 幅 增 加 目前 的 出 价 ， 否 则 其 将 支付 第 二 高 出 
价 和 人 的 估 值 (加 上 些许 增幅 ) 。 这 样 ， 增 价 拍卖 与 第 二 价格 担 卖 类 似 。 


单一 项 目 拍卖 


公开 密封 
增 价 降价 第 一 价格 第 二 价格 
4 4 
| 相似 


图 4-10 我 们 讨论 过 的 单一 项 目 拍卖 的 分 类 示意 图 


现在 考虑 降价 公开 担 卖 。 拍 卖 人 不 断 降 低 价 格 ， 直 到 价格 降 至 最 高 
出 价 者 的 水 平 ， 此 时 最 高 出 价 者 将 终止 拍卖 。 只 要 该 出 价 者 不 等 价格 进 
一 步 下 降 〈 也 就 是 持 谨慎 态度 ) ， 他 束 将 支付 自己 的 估 值 ， 这 是 最 局 价 
格 。 这 样 ， 降 价 担 卖 相 当 于 第 一 价格 拍卖 。 


有 些 单一 项 目 拍卖 既 不 严格 封闭 ， 也 不 严格 公开 。 例 如 ， 在 亿 贝 的 
拍卖 中 ， 投 标 人 通过 报价 了 解 当前 最 高 出 价 ， 这 是 下 一 个 出 价 能 被 接受 
的 最 低 值 。 虽 然 投 标 人 不 能 确定 最 高 出 价 是 多 少 《 即 不 严格 的 公开 拍 
卖 ) ， 但 他 们 能 了 解 拍 卖 的 当前 状态 《〈 即 不 严格 的 封闭 拍卖 ) 的 信息 。 
因此 ， 亿 贝 位 于 中 间 地 带 ， 在 整个 过 程 中 将 部 分 反馈 发 给 每 个 投标 人 。 
关于 亿 贝 拍卖 及 其 运行 方式 的 示例 ， 请 参考 本 书 网 站 Q4.1 和 Q4.2 部 分 。 


广义 二 价 拍卖 


鉴于 谷歌 等 搜索 广告 公司 有 多 个 广告 位 置 出 售 ， 它 们 的 拍卖 实际 上 
是 多 项 目 担 卖 ， 即 有 多 个 项 目 ( 广 告 》 提 供给 投标 人 。 让 我 们 尝试 用 一 
个 简单 的 方法 ， 将 单一 项 目 密封 拍卖 应 用 于 谷歌 天 键 词 广告 。 


图 4-11 显 示 ， 有 三 个 广告 客户 〈“ 即 投标 人 ) 和 三 个 广告 位 置 。 每 个 
投标 人 安娜、 本 和 查理 ) 对 每 次 点击 收入 有 不 同 的 预期 ， 同 时 每 个 广 
告 位 置 (1、2 和 3)〉 有 不 同 的 点 击 率 。 一 个 特定 的 广告 位 置 对 于 投标 人 
的 估 值 ， 等 于 点 击 率 乘 以 每 次 点 击 的 预期 收入 。 这 样 总 共有 9 个 不 同 的 
估 值 ， 例 如 ， 本 对 于 位 置 3 的 预期 收入 每 小 时 ) 为 40 美 元 x1 = 40 美 
元 。 
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图 4-11 谷歌 广告 拍卖 示例 
注 : 有 三 个 投标 人 【安娜 、 本 和 查理 ) 和 三 个 广告 位 置 (1、2 和 3) 


为 了 参与 招 卖 ,广告 客户 要 提供 给 谷歌 什么 ?他 们 的 每 次 反击 收入 
(或 者 更 准确 地 说 ， 他 们 对 每 次 点 击 的 估 值 〉。 有 趣 的 是 ， 谷 歌 只 会 从 
每 个 广告 客户 那里 获得 一 个 数字 ， 而 不 是 对 每 个 广告 位 置 都 有 一 个 数 
字 。 这 表明 ， 无 论点 击 来 自 哪 个 位 置 ， 它 对 相同 买 家 的 价值 都 是 一 样 
的 。 但 是 ， 买 家 可 能 对 第 一 个 广告 位 置 估 值 为 每 次 点 击 100 美 元 ， 对 第 
二 个 的 估 值 只 有 每 次 点 击 95 美 元 ， 因 为 点 击 接近 顶端 的 位 置 可 能 有 更 高 
的 机 会 促成 购买 。 为 简便 起 见 ， 赞 助 搜 索 行业 认为 ， 一 个 数字 惑 够 了 。 


多 项 目 拍卖 将 给 每 个 广告 客户 分 配 一 个 单独 的 广告 《如 果 买 家 比 位 
置 数 更 多 ， 或 位 置 数 比 买 家 更 多 ， 这 只 会 导致 一 些 广告 客户 没有 位 置 ， 
或 产生 一 些 空位 置 ) 。 对 于 广告 位 置 的 分 配 和 收费 ， 谷 歌 关 键 词 广告 使 
用 广义 二 价 (generalized second-price， 简 称 GSP) 拍卖 : 


由 广告 客户 出 价 : 每 个 买 家 提交 一 个 出 价 ， 这 是 他 们 愿意 为 
每 次 点 击 支付 给 谷歌 的 价格 。 

由 谷歌 匹配 : 广告 位 置 按 出 价 降序 分 配给 买 家 。 所 以 ， 出 价 
最 高 者 得 到 第 一 个 广告 位 置 ， 第 二 高 者 得 到 第 二 个 位 置 ， 以 此 类 
推 。 

广告 客户 向 谷歌 支付 : 每 个 买 家 为 广告 位 置 支付 价格 的 方 

法 ， 就 是 我 们 看 到 的 第 二 价格 、 单 一 项 目 拍卖 方式 。 最 高 投标 人 支 
付 的 价格 ， 有 是 第 二 高 出 价 者 愿意 为 第 一 个 位 置 支付 的 价格 ， 第 二 高 
出 价 者 支付 的 价格 ， 是 第 三 高 出 价 者 愿意 为 第 二 个 位 置 支付 的 价 
格 ， 以 此 类 推 。 


有 了 这 种 方法 ， 我 们 来 看 看 图 4-11 中 拍卖 的 结果 。 假 设 每 个 投标 人 
的 出 价 是 其 真实 估 值 ， 安 娜 、 本 和 查理 将 分 别提 交 每 次 点 击 20 美 元 、40 
美元 和 10 美 元 作为 他 们 的 出 价 。 哪 些 位 置 将 分 配给 他 们 ? 根据 广义 二 
价 ， 出 价 最 高 者 获得 最 有 价值 的 广告 位 置 ， 出 价 第 二 高 者 得 到 第 二 有 价 
值 的 位 置 ， 以 此 类 推 。 所 以 ， 本 得 到 第 一 个 ， 安 娜 得 到 第 二 个 ， 俘 理 得 
到 第 三 个 ， 如 图 4-12 所 示 。 


vp» 上 
次 点 es ge i i 
中 次 投标 人 匹配 广告 位 置 点 击 率 
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图 4-12 图 4-11 示 例 中 客户 广告 位 置 的 广义 二 价 分 配 


每 个 买 家 将 支付 给 谷歌 多 少 费用 ? 根据 广义 二 价 ， 买 方 支付 价款 等 
于 下 一 个 出 价 最 高 者 为 其 广告 位 置 支付 的 价格 : 


。 本 每 次 点 击 被 收取 20 美 元 《安娜 的 出 价 ) 。 点 击 率 为 每 小 时 
10 次 ， 他 每 小 时 的 支付 金额 为 20 美 元 X10 = 200 美 元 。 

。 安娜 每 次 点 击 被 收取 10 美 元 (查理 的 出 价 ) ， 点 击 率 为 每 小 
时 5 次 ， 总 额 为 每 小 时 10 美 元 X5 =50 美 元 。 

。 对 于 查理 来 说 ， 没 有 “下 一 个 最 高 ”的 投标 人 。 在 这 种 情况 
下 ， 谷 歌 采取 其 标准 最 低 出 价 。 如 果 是 每 次 点 击 3 美元 ， 那 么 查理 每 
小 时 将 支付 3X1 美 元 =3 美 元 。 


谷歌 将 从 拍卖 中 赚 到 多 少 钱 ? 把 买 家 的 付 球 相 加 ， 谷 歌 每 小 时 将 从 
扫 卖 中 获得 200 美 元 +50 美 元 +3 美 元 =253 美 元 ， 只 要 点 击 率 和 预期 的 一 
样 。 三 个 广告 客户 的 回报 如 何 ? 回顾 前 面 的 内 容 : 回报 是 估 值 和 支付 价 
格 之 差 。 我 们 已 经 计算 了 付 蒜 ， 所 以 只 需要 估 值 : 


。 ”本 对 广告 位 置 | 的 估 值 是 他 的 每 次 点 击 收入 (40 美 元) 和 该 
位 置 点 击 率 〈10) 相 乘 的 结果 ， 共 计 40 美 元 X10 = 400 美 元 。 所 


以 ， 他 每 小 时 的 回报 是 400 美 元 - 200 美 元 = 200 美 元 。 

同样 ， 安 娜 对 广告 位 置 11 的 估 值 是 20 美 元 X5 = 100 美 元 ， 
所 以 她 每 小 时 的 回报 是 100 美 元 - 50 美 元 = 50 美 元 。 

最 后 ， 查 理 对 广告 位 置 111 的 估 值 为 10 美 元 X1 = 10 美 元 ， 
那么 他 每 小 时 的 回报 是 10 美 元 - 3 美元 = 7 美元 。 


总 之 ， 每 小 时 的 总 回报 是 200 美 元 +50 美 元 +7 美 元 = 257 美 元 〈 只 要 
点 击 率 等 于 预期 ) 。 表 4-1 从 买 家 的 角度 总 结 了 结果 。 
表 4-1 基于 购买 者 角度 的 广义 二 价 广告 拍卖 示例 概要 


买 家 收入 广告 估 值 价格 回报 

安娜 20 II 100 50 50 
本 40 I 400 200 200 

查理 10 III 10 3 7 


注 : 收入 单位 为 每 次 点 击 ， 估 值 、 收 费 和 回报 单位 为 每 小 时 


广义 二 价 是 谷歌 用 来 确定 广告 位 置 竞买 人 排名 的 方法 ， 谷 歌 以 此 决 
定 他 们 在 相关 关键 词 设置 下 的 搜索 结果 页 面 如 何 排序 ， 并 实现 利润 最 大 
化 。 然 而 ， 为 了 确定 匹配 ， 广 义 二 价 不 是 唯一 可 以 使 用 的 机 制 。 其 他 我 
们 没有 讨论 的 方法 可 能 会 产生 不 同 的 结果 。 事 实 上 ， 对 于 多 项 目 拍卖 ， 
广义 二 价 并 不 鼓励 诚实 的 报价 ， 虽 然 它 只 针对 单一 项 目 拍 卖 。 另 一 种 被 
称 为 VCG (Vickrey-Clarke-Groves) 的 方法 在 任何 情况 下 都 鼓励 诚 
实 报价 。 但 这 种 方法 也 有 人 缺点。 因为 对 于 什么 是 “正确 ”的 排名 这 一 问 
题 ， 它 会 有 一 个 以 上 的 答案 。 


应 该 说 明 的 是 ， 在 描述 本 章 不 同类 型 的 拍卖 时 ， 我 们 对 佑 值 的 性 
质 、 每 次 点 击 收入 和 点 击 率 做 了 一 些 简 化 问题 的 假设 。 如 果 你 有 兴趣 对 
其 了 解 更 多 ， 请 参考 本 书 网 站 Q4.3 部 分 。 


我 们 现在 了 解 了 谷歌 如 何 创造 其 大 部 分 收入 。 接 下 来 ， 让 我 们 探讨 


谷歌 如 何 将 其 标准 页 面 的 结果 排序 ， 以 尽 可 能 提高 搜索 效率 和 质量 。 


第 5 章 
排列 搜索 疆 
毫 无 疑问 ， 你 和 几乎 所 有 你 认识 的 人 都 使 用 谷歌 搜索 。 输 入 一 个 短 


语 到 搜索 查询 ， 扣 击 回 车 ， 可 能 束 会 弹出 数 以 百 万 计 的 相关 链接 。 很 可 
能 你 会 在 最 初 几 个 结果 中 发 现 你 寻找 的 答案 。 


自 1989 年 互联 网 诞生 以 来 ， 互 联网 上 的 信息 量 就 在 迅速 增长 。 很 难 
估计 今天 到 底 有 多 少 个 网 页 ， 但 目前 统计 可 能 有 60 万 亿 个 〈60 000 000 
000 0001 ) 。 


谷歌 等 搜索 引擎 如 何 记录 所 有 这 些 页 面 呢 ? 实际 上 ， 每 个 引擎 都 有 
自己 的 数据 库 ， 存 储 所 有 它 知道 的 网 页 信息 。 随 着 网 络 的 迅速 发 展 和 演 
变 ， 它 们 如 何 使 其 数据 库 保持 更 新 ? 通过 不 断 抓 取 网 页 ， 使 用 程序 自动 
跟踪 链接 从 一 个 网 页 换 到 下 一 个 ， 并 在 此 过 程 中 添加 新 网 页 到 数据 库 ， 
更 新 现 有 网 页 条 目 。 但 是 没 人 能 保证 这 个 抓 取 过 程 会 到 达 所 有 页 面 。 


随 着 时 间 的 推移 ， 谷 歌 的 索引 规模 急剧 增长 。 在 图 5-1 中 ， 你 可 以 
看 到 谷歌 的 变化 (从 1997 年 到 它 停止 在 首页 宣传 其 数据 库 中 的 网 页 数 
量 ) 。 索 引 规模 在 20 年 内 呈 指 数 上 升 ， 由 1997 年 的 2 400 万 增加 到 2005 
年 的 80 亿 ， 再 到 2015 年 的 60 万 亿 。 


编制 索引 网 页 数量 (10 亿 ) 
OO ID oa 人 hh 个 ~ 0 人 


1997 1998 1999 2000 2001 2002 2003 2004 ”2005( 年 份 ) 


图 5-1 谷歌 编制 索引 网 页 的 数量 
注 : 从 1997 年 谷歌 成 立 到 2005 年 其 停止 在 主页 上 发 布 该 信息 时 


如 果 谷 歌 有 上 万 亿 的 页 面 案 引 ， 那 么 当 你 输入 搜索 查询 时 ， 为 什么 
通常 会 在 最 初 几 个 结果 中 就 发 现 你 所 需要 的 信息 呢 ? 这 是 我 们 感 兴趣 的 
问题 。 显 然 ， 页 面 不 是 以 谷歌 编制 索引 的 顺序 显示 。 事 实 上 ， 搜 索引 擎 
使 用 其 著名 算法 一 一 网 页 级 别 ， 它 通过 解决 巨大 的 方程 组 ， 以 确定 每 个 
网 页 的 重要 性 ， 然 后 按 重 要 性 从 高 到 低 ， 将 相关 碍 询 结果 排序 。 


相关 性 与 重要 性 


网 页 排序 的 概念 可 以 退 调 到 20 世 纪 90 年 代 初 期 ， 第 一 代 搜 索引 擎 诈 
生 时 。 妆 然 ， 当 时 的 搜索 引擎 远 不 如 今天 成 熟 。 由 于 存储 和 计算 能 力 的 
限制 ， 它 们 的 数据 库 相 当 小 ， 只 能 存储 页 面 的 子 集 ， 如 标题 和 不 同 部 分 
的 小 标题 。 这 样 ， 搜 索 才 可 以 快速 和 低 成 本 地 进行 。 


这 种 部 分 抽取 的 影响 是 什么 ? 是 信息 和 搜索 精度 的 巨大 损失 。 例 
如 ， 假 设 本 书 第 二 部 分 是 互联 网 上 的 一 个 网 页 。 当 为 它 建立 一 个 数据 库 
条 目 时 ， 第 一 代 搜 索引 擎 很 可 能 只 通过 存储 标题 (例如 “排序 很 难 ”“ 公 


开 扫 卖 “ 排 列 搜索 结果 “相关 性 与 重要 性 ”) 来 表示 。 然 后 ， 将 用 户 搜 
索 查 询 中 的 文字 与 该 数据 库 条 目 中 的 文字 进行 比较 ， 以 查看 是 个 有 匹配 
项 。 因 此 ， 如 果 用 户 搜索 “拍卖 ”， 它 会 在 第 二 部 分 找到 一 个 匹配 项 。 但 
如 果 碍 询 “ 搜 索引 擎 ”， 则 不 会 发 现 匹配 项 ， 即 使 这 是 我 们 讨论 的 重要 间 


让 


技术 进步 很 快 使 全 文 搜索 (full text search) 成 为 可 能 。 通 过 全 
文 搜 索 ， 网 页 内 容 的 每 个 字 都 存储 在 数据 库 中 ， 人 允许 搜索 查询 与 所 有 内 
容 匹 配 。1994 年 ， 网 络 爬 虫 成 为 第 一 个 提供 这 一 功能 的 知名 搜索 引擎 ， 
它 于 一 年 后 被 美国 在 线 收购 。 


按 相 关 性 排序 


如 宁 你 设计 一 个 搜索 引擎 ， 会 如 何 给 网 页 排序 ? 也 许 ， 对 于 用 户 输 
入 的 特定 搜索 查询 ， 你 会 按照 页 面 出 现 查 询 文 字 的 次 数 来 排列 。 毕 竟 ， 
碍 询 文字 出 现 的 次 数 越 多 ， 惑 表明 匹配 度 越 高 。 你 可 以 在 图 5-2 中 看 到 
一 个 非常 小 的 例子 : 当 用 户 搜索 “香草 时， 每 个 页 面 都 会 检查 这 个 词 出 
现 的 次 数 。 四 个 标 有 A~D 的 网 页 包含 这 个 词 ， 出 现 次 数 分 别 是 1、5、9 
和 2。 搜 索 结果 页 面 将 这 四 个 页 面 的 链接 排序 为 C、B、D、A 每 个 页 
面 用 一 些 文字 进行 简短 描述 ) 。 


链接 至 C 
来 自 C 的 部 分 文本 
链接 至 B 


来 日 B 的 部 分 文本 


链接 至 D 
来 日 DD 的 部 分 文本 
链接 至 A 
来 日 A 的 部 分 文本 


图 5-2 基于 相关 性 的 搜索 结果 排序 的 简单 示例 
这 种 计算 出 现 次 数 的 方法 是 衡量 网 页 和 碍 询 相关 度 《〈“ 即 两 者 关联 度 
大 小 ) 的 方式 之 一 。 基 于 相关 性 的 排名 是 早期 搜索 引擎 采取 的 方法 ， 也 
是 搜索 结果 排序 的 依据 。 换 句 话 说 ， 它 们 将 相关 度 较 高 的 页 面 显示 在 相 
关 度 较 低 的 页 面前 ， 以 将 最 有 用 的 结果 放 在 前 面 。 


在 组 合 中 增加 重要 性 


仅仅 根据 相关 性 来 排序 是 搜索 引擎 的 最 好 选择 吗 ? 如果 我 们 考虑 谷 
歌 搜 索 在 过 去 20 年 中 取得 的 广泛 成 功 ， 答 案 将 是 人 否定 的 。 


谷歌 于 1997 年 进入 搜索 引擎 领域 。 当 时 ， 它 的 两 个 创始 人 谢 尔 六 


布 林 和 拉 里 : 佩 奇 提出 了 网 页 排序 的 新 方法 。 对 他 们 来 说 ， 搜 索引 擎 是 
有 效 完成 这 一 艰巨 任务 的 最 佳 方式 ， 能 考虑 到 每 个 网 页 的 两 个 不 同 因 
素 : 


。 相 关 性 得 分 (relevance score) ,根据 相关 性 概念 ， 确 定 网 
页 内 容 和 指定 搜索 查询 的 相关 性 ; 


。 重 要 性 得 分 (importance score) ， 衡 量 网 页 重要 性 ， 不 考 
虑 页 面 内 容 和 搜索 文字 。 


相关 性 得 分 的 计算 确实 使 谷歌 的 远见 与 众 不 同 ， 人 至 少 在 一 定 程度 上 
如 此 。 特 别 是 ， 谷 歌 开 始 考虑 某 些 因素 ， 如 字母 大 写 、 字 体 和 内 容 位 
置 ， 这 是 当时 其 他 搜索 引擎 没有 做 的 。 但 使 网 页 级 别 (PageRank) 
《谷歌 的 排名 算法 ， 此 次 命名 利用 了 拉 里 : 佩 奇 名 字 的 巧妙 双关 ) 比 以 
前 的 方法 更 为 成 功 的 是 重要 性 的 概念 。 自 20 世 纪 90 年 代 末 以 来 ， 它 一 直 
是 使 谷歌 成 名 的 驱动 力 。 截 至 2015 年 ， 谷 歌 占据 了 整个 搜索 引 苟 市场 的 
近 2/3 的 “江山 ”， 如 图 5-3 所 示 。 


搜索 引擎 ”美国 在 线 
1.8% |.1% 


必 应 


20.0% 


图 5-3 2015 年 3 月 ， 美 国 最 受 欢迎 的 五 个 搜索 引擎 的 市 场 占有 率 


注 : 虽然 必 应 (Bing) 在 过 去 几 年 里 一 直 在 稳步 增加 其 份额 ， 但 谷歌 搜索 仍然 占据 
了 2/3 的 市 场 份额 ， 这 个 数字 是 必 应 目前 份额 的 三 们 和 多 


在 本 章 的 其 余部 分 ， 我 们 将 看 到 重要 性 得 分 是 如 何 确定 的 ， 包 括 了 
解 由 超 链 接 导 同形 成 的 页 面 网 络 ， 将 网 页 役 此 连接 形成 网 络 。 请 记 住 ， 
与 相关 性 评分 不 同 ， 每 个 页 面 的 重要 性 不 会 随 用 户 输 入 的 搜索 查询 而 改 
变 ， 也 不 取决 于 页 面包 含 的 内 容 。 相 反 ， 它 完全 基于 一 张 展示 网 页 如 何 
连接 的 结构 图 。 


图 和 网 络 图 


网 页 通过 超 链 接 (hyperlinks) 〈 即 网 页 中 用 户 可 以 跟踪 了 解 的 
外 部 数据 引用 〉 连 接 到 另 一 个 网 页 。 在 文本 中 髓 入 超 链接 是 创造 万 维 网 
不 可 或 缺 的 ， 因 为 超 链 接 是 网 页 互相 引用 的 手段 。 也 就 是 说 ， 如 果 一 个 


页 面 有 直接 的 超 链接 ， 它 就 会 将 用 户 带 到 另 一 个 页 面 。 


网 页 之 间 的 连接 可 以 简洁 地 用 图 (graph) 表示 。 《使 网 络 运行 的 
互联 网 也 可 以 被 描述 为 一 张 图 ， 我 们 之 后 会 看 到 。) 我 们 可 以 花 一 整 本 
书 来 介绍 图 论 的 数学 理论 ， 但 简单 的 术语 在 这 里 就 足够 了 : 图 包含 一 组 
节点 (nodes) (或 顶点 ) ， 它 们 由 链接 (links) (或 边 ) 相互 联 
系 。 在 本 章 中 ， 我 们 将 节点 视 为 网 页 ， 将 链接 作为 页 面 是 否 互 相 引 用 的 
指标 。 我 们 建立 的 结果 称 为 网 络 图 (webgraph) 。 网 络 图 是 有 向 
(directed) 的 ， 表 示 其 链接 不 对 称 : 页 面 A 引用 页 面 B 并 不 代表 页 面 B 
会 引用 页 面 A。 


顺便 说 一 句 ， 我 们 将 在 本 书 中 看 到 许多 不 同类 型 的 图 。 它 们 的 区 别 
在 于 构成 三 反 的 元 素 和 节点 之 间 的 联系 具体 代表 的 对 象 。 除 了 在 这 里 看 
到 的 网 页 图 ， 我 们 将 讨论 其 他 图 ， 例 如 第 12 章 的 互联 网 路 由 需 图 〈 其 中 
的 连接 是 实际 连接 ) 和 第 8、10、14 章 的 人 类 连接 图 (其 中 的 连接 是 社 
会 联系 ) 。 


网 络 图 对 于 理解 重要 性 得 分 很 有 必要 ， 因 为 它们 概括 了 网 络 的 连接 
性 。 后 面 ， 我 们 将 使 用 图 5-4 中 的 《非常 小 的 ) 图 表 来 演示 计算 重要 性 
分 数 的 关键 步骤 。 在 这 张 网 络 岁 中 ， 有 4 个 页 面 (W、X、Y 和 Z) 和 8 个 
超 链 接 。 我 们 假设 所 有 这 些 页 面 都 与 用 户 输入 的 搜索 查询 有 关 ， 因 此 筷 
们 都 将 在 结果 页 上 显示 ， 问 题 在 于 显示 在 何 处 。 


另 一 方面 ， 你 会 发 现 我 们 在 本 书 中 坚持 使 用 小 图 表 ， 它 们 可 以 显示 
在 一 页 上 ， 既 容易 理解 又 能 说 明 要 点 。 不 过 ， 让 我 们 设想 整个 网 络 的 续 
构 是 什么 样子 的 。 我 们 可 以 肯定 地 说 ， 在 这 些 数 以 万 亿 计 的 市 点 之 间 ， 
这 张 图 看 起 来 极其 稀 鸣 (sparse) ， 这 意味 着 大 多 数 网 页 只 连接 到 网 
络 中 其 他 网 页 中 的 一 小 部 分 。 即 使 是 维基 百科 的 一 张 有 几 百 个 链接 的 大 
页 面 ( 这 比 普通 网 页 要 多 得 多 ) ， 也 仅仅 连接 到 数 万 亿 贡 点 中 的 一 小 部 


分 。 


网 页 级 别 不 做 什么 


那么 ， 是 什么 让 一 张 页 面 变 得 “重要 ”? 也 许 是 指向 它 的 页 面 数量 ? 
这 被 称 为 网 页 的 入 度 (in-degree) ， 它 可 以 衡量 节点 有 多 少 导 入 链接 
(incoming links) : 


从 图 5 -4 中 ， 你 可 以 看 到 页 面 Y 有 来 自 页 面 内 _X 和 Z 的 导入 链 
接 ， 使 其 入 度 为 3。 


。 相 比 之 下 ， 页 面 X 的 入 度 为 2， 有 来 自 W 和 Z 的 导入 链接 。 
。 页 面 Z 的 入 度 也 是 2， 有 来 自 X 和 Y 的 导入 链接 。 
。 最后， 页 面 W 的 入 度 为 1， 有 来 自 Z 的 导入 链接 。 


图 5-4 一 张 小 网 络 图 示例 


注 : 图 中 包括 4 个 页 面 〈 节 点 ) 和 8 个 链接 。 该 图 是 有 向 的 ， 国 为 链接 不 对 称 : 例 
如 ， 页 面 W 指 向 页 面 X， 反 之 则 不 然 

根据 这 一 衡量 重要 性 的 手段 ， 谷 歌 将 按照 Y、X、Z、W 〈X 和 Z 可 
互 换 ) 的 顺序 返回 结果 。 但 这 是 否 说 明了 所 有 情况 ? 根据 谷歌 的 网 页 级 
别 算 法 ， 管 案 是 否定 的 。 我 们 现在 看 看 。 


随机 上 网 者 


谷歌 通过 一 个 人 随机 上 网 的 比喻 解释 了 网 页 级 别 的 概念 。 该 上 网 者 
进入 一 个 网 页 ， 并 不 断 随机 点 击 链接 。 在 这 个 过 程 中 ， 他 最 终 可 能 会 感 
到 无 聊 ， 并 在 浏览 器 中 输入 另 一 个 地 址 。 你 可 以 在 图 5-5 中 看 到 这 个 概 
念 ! 此 人 利用 超 链接 从 A 到 D， 再 到 E， 然 后 随机 在 浏览 器 中 输入 F， 以 
此 类 推 。 根 据 网 页 级 别 ， 某 个 页 面 在 这 一 过 程 中 的 访问 率 ( 相 对 于 访问 
所 有 页 面 的 总 次 数 ) 是 该 网 页 的 重要 性 。 


图 5-5 随机 上 网 者 原理 


注 : 一 个 人 开始 在 页 面 A， 随 机 点 击 一 个 超 链 接 ， 选 择 D。 他 从 D 再 次 选择 一 个 引用 链 
接 ， 来 到 E。 转 到 E 后 ， 此 人 决定 在 浏览 器 中 输入 一 个 随机 地 址 ， 转 到 F。 在 F， 他 点 
击 一 个 链接 到 G， 该 过 程 继续 


我 们 将 逐步 分 解 随 机 上 网 过 程 。 假 设 用 户 利用 超 链接 ， 从 中 随机 抽 
取 。 从 一 个 给 定 的 页 面 ， 随 着 网 页 的 出 度 (out-degree) 增 大 ， 他 选 
择 一 个 特定 超 链接 的 概率 会 相应 减 小 。 出 度 是 节点 的 导出 链接 

(outgoing links) 数 ， 而 入 度 是 导入 链接 的 数量 。 


回 到 图 5-4。 比 如 页 面 W 的 出 度 是 2。 页 面 W 的 随机 上 网 者 有 50% 的 
概率 会 转 到 页 面 X， 也 有 509% 的 概率 会 选择 页 面 Y。 他 不 能 直接 去 页 面 
Z， 因 为 没有 这 个 链接 。 


那么 ， 用 户 一 开始 在 某 个 网 页 的 概率 是 多 少 呢 ? 正如 我 们 之 前 提 到 
的 ， 这 肯定 取 诀 于 该 页 面 的 入 度 。 但 这 还 取决 于 其 他 因素 : 指向 该 页 面 
的 链接 的 重要 性 。 例 如 ， 尽 管 Z 只 有 两 个 导入 链接 ， 其 中 一 个 来 目 
Y《〈 这 在 入 度 上 是 最 重要 的 ) 。 如 条 Y 很 可 能 被 访问 ， 那 么 Z 被 访问 的 可 
能 性 至 少 一 样 大 ， 因 为 一 旦 来 到 Y， 上 网 者 唯一 的 选择 就 是 点 击 页 面 
Z! 


从 图 中 量化 重要 性 
我 们 可 以 通过 网 络 图 中 的 节点 和 和 链接， 直观 地 体现 入 度 、 出 度 和 网 
页 重要 性 的 概念 。 每 个 节点 都 将 被 赋予 一 个 重要 性 得 分 ， 我 们 分 别 用 小 


写字 母 v、x、y 和 z 代 表 页 面 W 到 Zz 的 得 分 ， 如 图 5-6 所 示 。 我 们 可 以 把 一 
个 页 面 的 重要 性 等 同 于 它 在 随机 上 网 过 程 中 被 选择 的 机 会 。 每 个 链接 有 
一 个 起 始 节点 和 一 个 端 节点 ， 可 以 显示 随机 上 网 者 从 来 源 网 页 点 击 ， 进 
入 目标 网 页 的 概率 。 换 句 话说 ， 页 面 通过 导出 超 链接 “传播 ”其 重要 性 。 


例如 ， 看 页 面 X。 如 果 上 网 者 在 页 面 2 或 W， 而 且 都 可 能 会 选择 X， 
那么 我 们 可 以 把 它 分 为 两 部 分 ， 从 W 转 到 X 的 概率 以 及 从 Z 转 到 X 的 概 


首先 ， 从 W 转 到 X 的 概率 是 多 少 ? 这 要 求 (1) 在 W 时 转 到 X; 
(2 ) 一 开始 位 于 Wi: 


图 5-6 


注 : X 的 重要 性 评分 x 取 决 于 W 和 2Z。 由 于 W 和 2Z 的 入 度 为 2 和 3， 因 此 这 些 链接 的 权重 为 w 
/ 2 和 z / 3 


。 对 于 (1) ， 我 们 之 前 说 过 ， 从 W 转 到 页 面 X 的 概率 是 50%， 或 
1/2。 


。 对 于 (2) ， 这 就 是 W 的 重要 性 ， 也 就 是 w。 


因为 这 些 事件 必须 同时 发 生 ， 所 以 我 们 将 其 概率 相 乘 〈 类 似 于 第 2 
章 讨论 Wi-EFi 协 议 时 ， 将 不 发 送信 号 的 概率 相 滋 ) 。 结 果 是 wx1/2 


=W/2。 
其 次 ， 从 Zz 转 到 X 的 概率 是 多 少 ? 我 们 可 以 运用 同样 的 逻辑 : 这 要 
求 (1) 从 Z 转 到 X; (2) 一 开始 位 于 Z: 


对 于 (1) ，X 是 三 种 可 能 性 之 一 ， 所 以 概率 是 ! / 3，, 或 
33. 33%。 


。 对 于 (2) ， 概 率 就 是 z。 


两 者 相 乘 ， 就 是 zx1 / 3 =z / 3。 


既然 我 们 可 以 从 W 或 Z 到 达 X， 那 么 把 这 些 概率 相 加 ，X 的 重要 性 得 
分 表达 为 : x=w/2+z/3。 


页 面 Y 怎 么 样 ? 它 可 以 从 图 中 任何 其 他 页 面 选 择 ， 因 为 它们 都 指 癌 
那里 。 从 W 有 50% 的 概率 选择 Y， 从 X 也 有 50% 的 概率 ， 从 Z 有 33.33% 的 
概率 。 所 以 ，y=w/2+x/2+z/3， 如 图 5-7 所 示 。 


图 5-7 


注 : 页 面 Y 的 重要 性 评分 取决 于 W、X 和 Z。 由 于 W 和 X 的 出 度 均 为 2， 它 们 与 Y 的 链接 权 
重 为 w / 2 和 x / 2。 因 为 Z 的 出 度 为 3， 该 链接 权重 为 z / 3 


运用 这 一 逻辑 ， 对 图 5-4 中 的 四 个 网 页 ， 我 们 得 出 以 下 方程 ， 来 表 
示 重 要 性 得 分 之 间 的 关系 : 
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你 可 以 看 到 ， 一 个 网 页 的 重要 性 评分 取决 于 其 他 网 页 的 得 分 ， 而 其 
他 网 页 的 重要 性 得 分 义 取决 于 源 网 页 的 得 分 。 这 种 看 似 循环 的 迎 辑 需要 
我 们 解 开 一 个 方程 组 。 按 照 图 5-6 和 图 5-7 中 的 程序 ， 网 络 图 是 直观 显示 
方程 的 简单 方法 : 


1. 用 源 节 点 的 重要 性 除 以 其 出 度 ， 并 标注 每 个 链接 。 
2. 对 于 每 个 节点 ， 其 重要 性 得 分 等 于 所 有 导入 链接 值 的 总 和 。 


最 后 ， 方 程 的 数量 就 是 图 中 的 节点 数量 。 
解决 方案 


回 到 前 面 的 方程 组 ， 我 们 现在 有 四 个 方程 和 四 个 未 知 数 (w、x、y 
和 z) 。 有 一 组 重要 性 分 数 能 满足 所 有 方程 吗 ? 总 的 来 说 ， 有 很 多 方法 
能 解 开 这 样 的 方程 组 。 对 于 非常 大 的 网 络 图 ， 同 时 有 许多 变量 《例如 谷 
歌 的 60 万 亿 索 引 ) ， 工 程 师 们 已 经 找 出 成 熟 的 方法 ， 能 快速 高 效 地 找到 


答案 。 


如 有 果 你 对 如 何 仅仅 利用 基本 的 代数 运算 ， 笔 算 解 开 这 个 方程 组 感 兴 
趣 ， 请 参考 本 书 网 站 Q5.1 部 分 。 我 们 可 以 很 容易 地 验证 以 下 答案 的 正确 
性 : 


我 们 怎么 能 知道 呢 ? 只 需 将 这 些 值 放 回 方程 中 ， 确 保 其 都 能 成 立即 
可 。 例 如 ， 第 三 个 方程 y=w/2+x/2+z/3。 这 是 否 成 立 ? 是 的 : 右边 
相 加 为 2/31 + 3/31 + 4/31=9/31， 就 是 y。 你 能 以 同样 的 方式 计算 其 他 三 
个 方程 


我 们 也 可 以 通过 补充 网 络 图 的 不 同 组 成 部 分 ， 直 观 地 体现 解决 方 
案 。 你 可 以 在 图 5-8 中 看 到 。 对 于 每 个 网 页 ， 以 下 三 点 是 相等 的 ;页 面 
的 重要 性 得 分 、 导 入 重要 性 之 和 ， 以 及 导出 重要 性 之 和 。 例 如 ， 在 页 面 
Z，12/31 = 9/31 + 3/31 = 4/31 + 4/31 + 4/ 31。 在 页 面 X，6/31 = 2/31 + 
4/31 = 3/31 + 3/31。 


图 5-8 网 络 图 示例 的 重要 性 评分 和 链接 权重 
注 : 你 可 以 看 到 ， 每 个 网 页 的 重要 性 等 于 其 性 入 和 有 导出 重要 性 评分 的 总 和 


那么 ， 基 于 这 些 重 要 性 分 数 的 页 面 排序 是 什么 呢 ? 按 重 要 性 从 高 到 
低 排列 的 顺序 依次 为 2、Y、X、W。 如 果 仅 根据 本 章 前 面 的 入 度 方法 ， 
排名 则 是 Y、X、Z、W。 基 于 网 页 级 别 ，Y 不 再 是 最 重要 的 ，Z 则 成 为 
最 重要 的 网 页 。 即 使 页 面 Y 有 最 多 的 导入 链接 ， 网 页 级 别 也 会 考虑 到 这 
些 链接 的 “等 级 ”: 特别 是 Y 的 两 个 导入 链接 来 目次 要 节点 W 和 X， 其 中 


只 有 一 半 的 重要 性 被 传播 到 Y， 虽 然 另 一 个 链接 来 自 Z， 但 这 只 会 带 来 
1/3 Z 的 重要 性 。 


此 外 ， 页 面 Z 可 能 只 有 两 个 导入 链接 ， 但 其 中 一 个 带 来 Y 的 全 部 重 
要 性 ， 因 为 Y 没 有 指 辣 其 他 节点。 由 于 Z 也 获得 X 的 重要 性 ， 因 此 它 自 然 
高 于 Y。 参 考 随机 上 网 者 概念 ， 这 是 有 道理 的 ， 因 为 当 上 网 者 来 到 Y， 
接 下 来 将 去 Z， 反 之 则 不 然 。 随 着 时 间 的 推移 ，Z 将 获得 比 Y 更 多 的 访 
问 ， 因 此 其 重要 性 排名 应 更 高 。 


在 表 5-1 中 ， 你 可 以 看 到 每 个 方法 的 重要 性 分 数 和 排名 概要 。 以 使 


结果 标准 化 ， 这 里 的 入 度 重 要 性 是 通过 用 每 个 页 面 的 入 度 除 以 所 有 节点 
的 入 度 总 和 “(8) 得 出 。 因 此 ， 页 面 W、X、Y 和 Z 的 入 度 为 1、2、3 和 
2， 我 们 得 到 1/8 = 0.125，2/8 = 0.25，3/8 = 0.375，2/8 = 0.25。 

表 5-1 图 5-4 中 网 络 图 的 重要 性 分 数 和 排名 计算 


注 : 网 页 级 别 能 影响 网 络 图 的 连接 性 ， 而 入 度 则 不 能 


排名 是 人 否 可 徘 ? 


我 们 看 到 的 是 一 种 方法 ， 它 能 让 我 们 找到 一 组 在 各 种 方程 之 间 均 取 
得 一 致 的 得 分 ， 从 而 实现 排名 。 然 而 ， 对 于 任何 网 络 图 ， 我 们 总 是 能 保 
证 形成 唯一 的 排名 吗 ? 


答案 是 : 还 不 能 。 总 的 来 说 ， 我 们 必须 对 程序 做 出 两 个 修改 ， 以 保 
证 得 到 唯一 的 解决 方案 。 这 包括 : 网 络 图 中 有 悬挂 节点 (dangling 


nodes) ， 即 不 指向 任何 其 他 节点 的 节点 ; 网 络 图 中 有 多 个 连通 分 支 

(connected components) 。 有 关 这 些 特殊 情况 以 及 网 页 级 别 如 何 
应 对 的 更 多 信息 ， 你 可 以 参考 本 书 网 站 Q5.2 和 Q5.3 部 分 。 可 以 说 ， 这 些 
修改 涉及 对 部 分 随机 上 网 过 程 做 出 的 说 明 ， 对 此 我 们 没有 详细 描述 。 如 
果 我 们 将 这 些 修正 应 用 于 程序 中 ， 那 么 网 页 级 别 将 始终 是 唯一 的 答案 。 


要 使 网 页 级 别 计算 的 具体 程序 用 于 数 以 万 亿 计 的 网 页 ， 需 要 一 些 超 
出 我 们 范围 的 高 等 数学 知识 。 但 你 现在 能 从 概念 上 理解 谷歌 如 何在 搜索 
结果 页 将 网 页 排序 。 虽 然 我 们 的 重点 几乎 一 直 是 如 何 得 出 重要 性 分 数 ， 
但 请 记 住 相关 性 得 分 也 是 搜索 引擎 原 理 的 重要 因素 ， 可 以 使 无 关 的 页 面 
《 即 没有 匹配 用 户 碍 询 内 容 的 页 面 ) 在 一 开始 就 被 过 滤 邱 。 


第 二 部 分 
当 疆 


/AN 二 口 


在 本 书 第 二 部 分 ， 我 们 探讨 了 排序 的 方法 ， 这 是 谷歌 运行 的 基 
础 。 我 们 研究 了 两 种 使 公司 筛选 有 关 竞 标 或 网 页 特定 项 目的 关键 案 
例 ， 以 实现 对 项 目的 有 效 排序 。 图 11 -1 概括 了 两 种 情况 : 在 拍卖 
中 ， 关 键 词 广告 采用 广义 二 价 拍卖 ， 以 确定 如 何 最 好 地 匹配 买 家 和 广 
告 位置 ; 而 通过 网 页 级 别 ， 谷 歌 从 极其 巨大 的 网 页 中 获得 重要 性 〈 及 


相关 性 ) 评分 ， 以 确定 在 搜索 结果 中 什么 位 置 显示 什么 页 面 。 


除了 搜索 引擎 、 广 告 位 置 和 谷歌 ， 排 序 还 出 现在 许多 网 络 环境 
中 。 因 此 ， 排 序 成 为 网 络 生 活 的 一 个 困难 但 必要 的 部 分 ， 也 就 不 足 为 
奇 了 。 排 名 原则 将 再 次 出 现在 第 6 章 和 第 10 章 ， 分 别 关 于 产品 列表 和 
社会 网 络 中 的 人 际 图 。 


图 上 -1 本 书 此 部 分 两 个 不 同 排序 案例 研究 的 总 结 


与 侨 里 克 ' 施 密 特 的 对 话 


埃 里 元 : 施 密 特 是 Aljphabet 公 司 〈 谷 歌 的 母 公 司 ) 的 执行 主席 。2001 
年 到 2011 年 间 ， 他 曾 担任 谷歌 首席 执行 官 。 


作者 : 让 我 先 问 你 这 个 问题 。 你 能 想象 没有 谷歌 的 世界 吗 ? 它 看 起 
来 是 什么 样 的 ? 


埃 里 克 : 我 记得 在 没有 谷歌 时 ， 知 识 主要 是 逸事 或 书本 知识 。 当 时 
的 情况 是 : 由 于 你 看 电视 和 读 报 纸 ， 所 以 会 对 事物 有 大 体 的 了 解 。 人 们 
会 来 告诉 你 一 些 事情 ， 但 你 没有 办 法 进行 核实 。 现 在 我 们 正 进行 核实 。 
人 们 总 是 对 我 说 一 些 可 能 不 真实 的 事情 ， 我 用 谷歌 来 检查 ， 这 就 是 谷歌 
本 身 的 工作 原理 。 如 果 你 正在 用 谷歌 ， 有 人 声称 诸如 “你 知道 吗 ， 月 腕 
最 近 被 证 明 是 局 平 的 ”， 你 会 将 这 句 话 和 输入， 并 知道 事实 并 非 如 此 。 所 
以 ， 一 且 你 形成 了 这 样 的 生活 方式 ， 每 当 有 人 次 了 什么 ， 就 去 检查 吧 。 
这 种 “信任 但 验证 ?的 模式 是 一 种 不 错 的 生活 方式 。 


作者 : 你 认为 这 取决 于 对 大 众 智慧 的 基本 假设 吗 ? 因为 谷歌 得 到 大 
家 公开 披露 的 信息 ， 所 以 所 有 人 在 同一 时 间 犯 错 的 概率 是 非常 小 的 ， 对 
人 么 ? 


埃 里 克 : 人 们 对 谷歌 的 评价 是 ， 一 般 说 来 ， 它 的 算法 足够 准确 ， 最 
终 能 让 大 多 数 人 相信 的 事实 排名 最 高 。 因 此 ， 以 “世界 是 平 的 ”这 人 句 话 为 
例 ， 如 采 你 输入 “世界 是 平 的 ”， 作 为 一 本 书 的 标题 ， 它 在 这 个 意义 上 是 
对 的 。 所 以 ， 如 果 我 们 谈论 的 是 《世界 是 平 的 》 这 本 书 ， 那 么 这 是 一 个 
真实 的 表述 ， 人 否则 就 是 假 的。 我 发 现 一 般 情 况 下 ， 谷 歌 的 最 高 排名 结 采 
都 相当 准确 ， 因 为 大 多 数 人 都 相信 事实 。 而 你 最 多 能 做 的 ， 就 是 当 有 人 


告诉 你 某 件 事 时 ， 比 如 “你 知道 国会 里 的 人 有 90% 是 非 犯 吗 ”， 你 把 它 输 
入 进去 ， 出 来 的 第 一 个 结果 是 Snopes《〈 一 个 力争 揭穿 常见 谣言 的 网 
站 ) ， 你 会 看 到 它 实 际 上 不 是 真 的 。 


作者 : 除了 信息 收集 和 展示 方面 ， 你 能 想象 今天 生活 的 其 他 部 分 没 
有 谷歌 吗 ? 


埃 里 克 : 我 们 希望 我 们 做 的 事情 和 使 用 牙刷 刷牙 一 样 规律 和 平常 。 
你 对 于 使 用 的 牙刷 不 会 想 太 多 ， 只 是 去 使 用 。 因 此 使 用 谷歌 邮箱 和 谷歌 
浏览 右 ， 把 你 的 信息 储存 在 “ 云 ? 中 ， 这 是 我 们 的 愿望 。 当 然 ， 我 使 用 所 
有 这 些 工 具 ， 我 把 一 切 都 存在 云端 。 现 在 我 最 喜欢 举 的 例子 是 照片 。 像 
大 多 数 人 一 样 ， 我 有 很 多 照片 储存 在 不 同 的 地 方 。 有 了 谷歌 相册 ， 我 现 
在 基本 上 可 以 把 它们 上 传 到 谷歌 邮箱 账户 ， 谷 歌 相册 还 会 进行 整理 ， 并 
删除 重复 数据 ， 你 还 可 以 搜索 图 片 中 的 内 容 。 它 使 用 机 器 学 习 和 机 器 视 
党 来 查看 图 片 。 


作者 : 说 到 机 器 学 习 和 大 数据 ， 你 认为 未 来 网 络 在 推荐 方面 ， 比 如 
推荐 观看 什么 视频 内 容 ， 推 荐 朋友 ， 推 荐 今天 做 什么 等 ， 将 变 得 多 么 个 
性 化 ?让 机 器 智 能 比 我 们 自己 更 了 解 我 们 ， 这 一 天 距离 我 们 还 有 多 远 ? 


埃 里 克 : 我 认为 这 里 有 两 个 不 同 的 问题 。 我 们 距离 为 人 们 提供 非常 
好 的 建议 有 多 远 ? 答案 是 非常 接近 。 原 因 是 ， 人 们 倾向 于 遵循 类 似 的 模 
式 ， 他 们 的 朋友 往往 是 相似 的 。 我 们 总 是 资 ， 每 个 人 都 是 不 同 的 。 你 有 
不 同 的 朋友 ， 但 事实 上 ， 你 的 朋友 往往 有 相同 的 文化 观 ， 显 然 还 说 同一 
种 语言 ， 并 且 年 龄 相仿 ， 有 相同 的 生活 经 历 ， 所 以 你 的 朋友 往往 能 很 好 
地 预测 你 喜欢 什么 类 型 的 东西 。 这 个 概率 不 是 100%， 但 是 相当 高 。 所 
以 当 我 们 运用 大 数据 寻找 建议 时 ， 例 如 在 视频 网 站 YouTube 上 ， 人 往往 会 
获得 很 好 的 推荐 。 


现在 重要 的 是 ， 要 知道 人 们 可 能 会 从 隐私 的 角度 来 看 这 个 问题 ， 但 
假设 你 已 经 选择 获得 这 些 建议 ， 我 党 得 它们 非常 有 用 。 这 并 不 意味 


独 “ 软 件 ” 会 成 为 与 你 交谈 的 茶 种 智能 生命 。 这 是 一 个 巨大 的 飞跃 。 我 认 
为 ， 我 们 现在 知道 的 是 ， 我 们 明白 计算 机 视觉 比 人 类 视觉 要 好 ， 所 以 像 
谷歌 相册 之 类 的 东西 运行 得 真 的 很 好 。 人 至 于 它 还 可 以 走 多 远 ， 我 认为 这 
古 一 个 推测 的 问题 。 每 个 人 部 想 要 一 个 机 器 人 ， 可 以 和 你 说 话 ， 并 不 断 
帮助 你 。 问 题 是 ， 这 多 久 以 后 会 及 生 ? 我 想 说 ,我 相信 将 来 会 有 一 个 相 
当 不 错 的 私人 工作 助理 说 :“ 埃 里 元 ， 你 需要 打 电 话 给 那个 普林斯顿 的 
教授 ， 你 像 往 币 一 样 迟到 了 。? 我 认为 那样 的 人 机 互动 是 很 有 可 能 的 。 

我 认为 除 此 之 外 ， 更 多 的 是 猜测 。 


作者 : 你 认为 是 否 可 能 出 现 一 种 趋势 ， 人 们 被 理解 为 以 某 种 方式 行 
事 ， 被 提供 要 做 的 事情 以 及 阅读 和 观看 的 内 容 ， 这 种 趋势 越 来 越 多 是 关 
于 “是 什么 ”， 而 不 是 “可 能 是 什么 ”? 换 句 话说 ， 机 器 智能 实际 上 是 强化 
了 人 们 目前 的 个 性 ， 而 不 是 给 他 们 一 个 机 会 去 尝试 完全 不 同 的 东西 并 涉 
足 新 领域 ? 


埃 里 克 : 在 过 去 的 10 年 里 ， 这 个 问题 以 许多 不 同形 式 被 提出 ， 到 目 
前 为 止 还 没有 证 据 表 明 这 种 偏见 存在 。 如 果 人 们 谈论 的 内 容 让 大 家 变 得 
更 加 狭隘 ， 我 则 认为 大 数据 世界 的 在 线 生 活 意 味 着 ， 你 接触 到 了 以 前 没 
有 接触 的 非常 多 的 东西 。 


让 我 们 回 到 谷歌 之 前 的 生活 。 在 那 种 生活 中 ， 你 去 上 学 ， 有 工作 ， 
有 家 隆 ， 看 电视 。 这 里 面 没有 很 多 不 同 的 观点 。 而 今天 ， 当 你 花 时 间 上 
推 敌 、 脸 书 ， 使 用 电子 邮件 等 ， 你 能 接触 到 广泛 得 多 的 不 同 说 法 。 顺 便 
说 一 下 ， 其 中 有 些 是 假 的 ， 然 后 你 用 谷歌 来 揭 罕 它们。 所 以 我 不 同意 这 
种 说 法 ， 我 理解 这 种 说 法 ， 但 没有 证 据 证 明 。 相 反 ， 有 很 多 证 据 表 明 ， 
人 们 上 网 时 会 接触 到 很 多 新 的 东西 ， 在 许多 情况 下 ， 捷 们 会 颠覆 人 们 的 
观念 。 但 人 们 不 想 昕 ， 也 不 同意 。 


作者 : 的 确 ， 在 YouTube 上 我 能 反复 看 到 推荐 给 我 的 相似 内 容 ， 也 
有 我 从 来 没有 想 过 我 会 看 到 的 全 新 内 容 。 


埃 里 克 : 对 于 产生 我 们 所 说 的 机 缘 巧 合 ， 这 些 系统 可 能 会 很 擅长 。 
你 不 知道 你 可 能 会 对 什么 东西 感 兴 趣 ， 但 它 能 发 现 ， 因 为 它 知 道 一 点 扩 
你 关注 的 东西 。 正 如 你 所 知道 的 ， 从 技术 上 说 ， 所 有 这 些 东 西部 是 经 过 
训练 的 大 型 神经 网 络 ， 所 以 它们 不 会 十 分 精确 。 但 是 对 于 一 般 的 观 色 式 
知识 和 对 事物 的 一 般 熟 严 上 ， 它 们 将 是 非 第 有 用 的 。 


没有 人 认为 它们 会 一 直 都 是 正确 的 ， 也 没有 人 声称 它们 总 是 真实 
的 。 我 们 不 说 谷歌 说 的 是 真 话 。 我 们 说 的 是 ， 谷 歌 尽 其 所 能 将 信息 排 
序 ， 以 给 出 这 种 情况 下 的 最 佳 答 案 ， 我 们 也 已 经 做 得 很 好 了 。 


作者 : 说 到 人 与 人 之 间 的 交流 ， 我 想 ， 过 去 只 有 电话 ， 然 后 就 有 了 
一 种 叫 电 子 邮 件 的 东西 。 然 后 还 有 短信 ， 还 有 社交 了 网络， 还 有 拍照 并 发 
送 给 其 他 人 ， 然 后 是 微 信 ，WhatsApp， 等 等 。 有 趣 的 是 ， 工 程 师 们 非 
党 努力 地 让 我 们 进行 同步 视频 聊天 ， 而 现在 人 们 最 吾 欢 的 是 非 同 步 的 联 
系 ， 互 相 发 送 文本 和 语音 信息 。 在 你 心目 中 ， 人 们 互相 交流 的 理想 方式 
是 什么 ? 


埃 里 克 : 你 还 记得 “独自 打 保龄球 ”的 说 法 吗 ? 它 认 为 社会 将 让 人 变 
成 一 个 个 孤立 的 个 体 ， 坐 在 沙 疏 上 看 电视 ， 而 不 进行 任何 社交 。 这 种 说 
法 唯一 的 问题 是 ， 它 是 完全 错误 的 。 如 果 你 看 看 今天 的 社会 ， 你 会 发 现 
人 们 总 是 在 过 度 交 流 ， 我 认为 这 吏 是 技术 的 教训 ， 人 们 总 是 想 用 各 种 可 
能 的 方式 来 交流 ， 你 会 看 到 他 们 交流 的 方式 多 种 多 样 。 我 不 认为 未 来 只 
会 有 一 种 交流 方式 。 举 例 来 说， 电子 邮件 曾经 是 最 好 的 沟通 方式 ， 而 不 
是 被 理解 为 还 有 不 同 的 形式 。 


我 给 你 举 个 例子 。 微 信 有 非常 好 的 信息 功能 。 你 可 以 运行 程序 ， 还 
可 以 按 下 一 个 按键 ， 给 劝 一 个 人 留 下 短语 音信 息 。 这 些 都 是 非常 丰富 的 
通信 环境 ， 是 点 对 点 的 联系 。 所 以 我 认为 你 会 看 到 很 多 不 同 的 通信 方 
式 。 当 我 和 你 说 话 时 ， 我 在 接收 电子 邮件 、 文 本 信息 和 语音 信息 ， 外 面 
还 有 人 想 打 断 我 。 这 在 今天 的 世界 是 正 币 的 。 我 不 是 说 这 对 人 关 有 区， 


但 这 是 事实 。 有 一 个 有 趣 的 统计 次， 人 在 一 周 内 会 触摸 1 500 次 手机 ， 
至 少年 平均 每 天 发 送 超过 100 条 文本 信息 。 我 刚 读 了 一 篇 文章 说 ， 
WhatsApp 信 息 数量 比 短信 发 送 总 数量 还 要 多 50%。 因 此 ， 通 信 半 命 的 程 
度 不 仅 深刻 ， 而 且 意 义 深远 。 这 是 所 有 通信 形式 的 巨大 爆发 式 增长 。 但 
你 还 是 会 听 到 有 人 抱 忽 这 一 点 。 但 我 们 是 人 类 ， 我 们 所 做 的 只 是 沟通 。 
这 是 我 们 从 原始 人 时 代 就 一 直 在 做 的 事 。 


作者 : 是 。 现 在 通信 也 有 代价 。 过 去 ， 你 按 通话 时 长 付费 ， 并 获得 
移动 设备 的 无 限 数据 流量 。 现 在 ， 至 少 在 美国 ， 情 况 完全 相反 。 你 可 以 
使 用 电话 的 通话 功能 ， 通 话 时 长 不 限 ， 但 你 必须 按 不 同等 级 为 移动 数 
据 ， 也 许 是 家 庭 定 价 计 划 人 付费。 


埃 里 克 : 原来 的 互联 网 并 没有 为 服务 收费 ， 每 当 你 为 菜 个 东西 收 
费 ， 束 会 创造 一 种 稀缺 性 。 电 信 运 营 商 为 带宽 收费 ， 因 为 它们 必须 回 政 
府 购买 昂贵 的 带宽 ， 而 且 租 赁 和 运行 都 很 难 ， 所 以 它们 受到 容量 制约 。 
政府 提出 一 个 称 为 共 圣 频谱 的 新 建议 ， 可 以 通过 共 至 频谱 进行 通话 ， 而 
不 是 让 单一 运营 商 拥 有 一 大 上 段 频谱 ， 这 将 在 实质 上 释放 带宽 。 


作者 : 那么 你 是 说 ， 按 不 同 机 会 访问 频谱 ， 而 不 是 静态 分 配 ， 可 以 
优化 频谱 的 使 用 效率 ， 达 到 更 充分 利用 的 程度 从 而 降低 成 本 ? 


埃 里 克 : 对 。 如 果 你 看 看 今天 的 频谱 ， 它 基本 上 一 直 是 空闲 的 。 对 
此 我 们 使 用 的 比喻 是 ， 我 们 的 公路 由 各 家 麦当劳 拥有 ， 要 是 只 带 你 到 你 
的 那 家 麦 当 荔 ， 其 他 什么 地 方 都 不 去 ， 这 没有 道理 。 你 应 该 分 享 。 所 以 
从 融 宽 的 角度 来 看 ， 共 宇 是 十 分 合理 的 ， 而 且 会 成 为 现实 。 


作者 : 随 痢 Nest 智 能 温 控 、 谷 歌 智能 眼镜 等 物 联 网 设备 的 崛起 ， 人 
们 看 到 智能 家 居 、 智 能 城市 、 智 能 工厂 正在 出 现 ， 环 顾 四 周 ， 你 发 现 按 
钮 可 能 是 电脑 ， 云 可 能 会 像 筋 一 样 下 降 到 我 们 映 边 。 但 人 们 也 担心 隐私 
和 安全 问题 ， 尤 其 是 围绕 网 络 边缘 ， 消 费 电 子 设 备 剧 增 并 联网 。 你 怎么 
看 待 物 联 网 的 安全 问题 ? 


埃 里 克 : 一 般 说 来 ， 我 们 应 该 能 够 确保 这 些 东西 相对 安全 。 运 用 现 
代 加 密 和 现代 算法 ， 通 信 应 该 是 高 度 个 人 和 蜗 度 安全 的 。 这 需要 通过 2 
048 位 加 密 法 、 椭 圆 曲 线 技术 加 密 一切 静 止 和 传输 中 的 数据 ， 所 以 你 看 
到 的 问题 是 因为 人 们 没有 充分 做 到 这 一 点 ， 他 们 需要 这 样 做 。 


作者 : 那么 ， 如 果 其 中 有 些 设备 没有 足够 强大 的 计算 能 力 或 能 量 ， 
来 运行 最 先进 的 加 密 技 术 ， 你 会 如 何 建议 ? 还 有 其 他 的 解决 办 法 吗 ? 


埃 里 克 : 我 还 是 不 同意 问题 的 前 提 。 现 在 网 络 的 所 有 算法 都 使 用 
HTTPS， 这 是 基于 SSL 的 HTTP。 人 们 有 很 多 和 争议， 因为 苹果 手机 是 如 
此 安全 ， 连 政府 都 不 能 拿 来 解锁 ， 我 相信 你 已 经 读 过 有 关 报 道 。 计 算 机 
速度 足够 快 ， 网 络 速度 也 足够 快 ， 可 以 不 受 限 制 地 满足 你 所 描述 的 需 
求 。 当 然 ， 最 终 还 是 存在 局 限 性 ， 但 我 们 还 没有 看 到 。 我 最 喜欢 的 例子 
是 ， 互 联网 的 主要 用 途 是 什么 ? 视频 。 你 怎么 能 想象 可 以 点 对 点 传输 视 
频 ? 咽 ， 不 论 如 何 ， 反 正 就 是 做 到 了 。 这 就 是 网 《和 YouTube 所 做 的 ， 
它们 做 得 很 好 ， 令 人 震惊 。 


作者 : 确实 如 此 。 说 到 YouTube， 它 无 疑 已 经 是 并 将 继续 成 为 一 个 
非常 成 功 的 部 署 ， 在 谷歌 所 做 的 一 切 事 情 中 还 有 许多 其 他 例子 。 我 访 了 
你 的 书 ， 想 知道 ， 在 你 看 来 谷歌 的 创新 方式 有 什么 特别 之 处 吗 ? 


埃 里 克 : 如 果 你 回 到 核心 公式 ， 你 会 发 现 谷歌 公司 是 由 技术 人 员 管 
理 ， 关 注 真 正大 赌注 的 技术 ， 而 且 我 们 还 有 非常 高 的 招聘 要 求 。 竺 运 的 
是 ， 我 们 的 广告 系统 产生 了 大 量 利润 ， 我 们 残 可 以 将 其 投入 到 这 些 新 技 
术 上 。 


作者 : 你 提 到 了 高 标准 的 招聘 要 求 。 你 认为 当前 在 美国 有 足够 
的 “人 才 ? 可 以 履 用 吗 ? 


埃 里 克 : 首先 ， 美 国 的 目标 应 该 是 把 所 有 真正 聪明 的 人 从 其 他 国家 
吸引 到 美国 。 不 幸 的 是 ， 我 们 的 政府 有 一 项 非常 轧 磊 的 政策 ， 就 是 H-1 


签证 限制 。 所 以 你 知道 ， 我 们 培养 了 最 好 和 最 聪明 的 人 才 ， 然 后 把 他 们 
踢 出 这 个 国家 。 这 真 的 很 愚 码 。 所 以 我 认为 你 永远 不 会 有 足够 的 人 来 创 
造 未 来 。 


作者 : 我 想 再 问 一 个 问题 。 想 想 
个 你 做 过 的 最 关键 的 决定 ， 那 会 是 什 


你 在 谷歌 的 时 候 ， 如 果 你 要 举 出 一 
人 么 ? 


埃 里 克 : 那 很 难说 ， 因 为 当 你 管理 一 个 公司 ， 你 只 要 尽量 快速 发 展 
就 可 以 ， 但 我 要 说 的 是 ， 我 们 做 过 最 重要 的 事情 是 ， 我 们 建立 了 一 个 系 
统 ， 将 创新 系统 化 。 换 句 话 说 ， 我 们 有 很 多 想法 ， 并 且 不 断 检 测 它们 ， 
然后 选择 那些 行 之 有 效 的 方法 ， 这 样 你 就 可 以 将 创新 系统 化 。 你 无 法 预 
测 ， 但 你 可 以 将 它 系统 化 ， 并 创造 能 扩展 规模 的 产品 。 我 们 将 创新 与 规 
模 结合 ， 生 产 快速 成 长 的 伟大 产品 ， 使 你 快速 成 长 。 如 果 你 想 看 谷歌 以 
外 的 例子 ， 那 就 看 优 步 吧 ， 那 是 一 个 相对 简单 的 想法 。 它 的 内 部 是 复杂 
的 ， 但 一 旦 你 做 得 对 ， 它 在 任何 地 方 都 能 用 ， 所 以 它们 可 以 迅速 扩展 到 
世界 各 地 ， 除 非 被 法 规 或 政府 禁止 。 但 产品 是 有 效 的 ， 一 旦 它 在 一 个 地 
方 起 作用 ， 你 就 可 以 在 任何 地 方 应 用 它 。 


作者 : 这 让 我 想起 了 福特 将 生产 流水 线 系统 化 的 事情 。 当 你 说 将 创 
新 过 程 系统 化 时 ， 和 是 如 何 对 创造 性 观念 进行 评 佑 ， 然 后 做 出 放 径 ， 改 进 
或 以 后 重新 评估 的 决定 的 ? 这 如 何 进行 ? 


埃 里 克 : 我 们 有 一 个 叫 “20% 时 间 ” 的 做 法 ， 鼓 励 人 们 在 他 们 感 兴趣 
和 好 奇 的 事情 上 花 15 的 工作 时 间 ， 许 多 想法 就 来 自 20% 时 间 。 这 是 好 消 
恩 。 坏 消息 是 ， 今 天 做 一 个 产品 需要 100 人 。 这 些 产 品 义 大 又 复 杂 ， 但 
它们 总 是 从 个 人 或 小 团队 的 想法 开始 ， 这 些 想 法 让 他 们 感到 兴奋 ， 然 后 
被 付 诸 实 施 。 因 此 ， 你 带 上 了 解 技术 发 展 的 高 级 技术 人 员 ， 创 造 更 多 这 
样 的 开端 ， 你 融会 变 得 更 有 创造 性 。 


作者 : 最 初 的 想法 ， 从 20% 时 间 探 索 到 决定 将 其 变 成 产品 ， 通 常 需 
要 多 少 轮 的 审查 和 完善 ? 


埃 里 克 : 我 不 认为 有 一 个 单一 规则 。 有 些 东西 发 展 得 更 快 ， 有 的 发 
展 得 慢 。 但 关键 是 ， 要 不 断 地 回顾 它们 ， 看 它们 是 否 取得 了 进展 。 有 的 
想法 有 用 ， 有 的 没 用 ， 没 关系 。 显 然 ， 一 旦 清楚 它 不 会 有 用 ， 你 越 快 放 
弃 它 并 重组 团队 就 越 好 。 


作者 : 我 想 ， 人 们 一 旦 习惯 了 这 个 过 程 ， 就 会 享受 这 个 过 程 吗 ? 


埃 里 克 : 这 很 难 。 人 们 不 希望 自己 的 项 目 失 败 ， 不 喜欢 受到 审查 。 
这 不 容易 。 


作者 : 到 目前 为 止 ， 它 的 表现 非常 棒 。 埃 里 克 ， 谢 谢 你 分 享 你 的 想 
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第 三 部 分 


大 众 很 了 乳 明 


零售 购物 、 看 电影 和 上 课 只 是 我 们 受到 互联 网 影响 的 三 种 日 常 活 
动 。 因 为 有 亚马逊 等 电子 商务 网 站 、 网 飞 等 内 容 分 发 网 站 ， 以 及 慕 课 
等 在 线 课 程 网 站 的 提供 者 ， 我 们 可 以 在 舒适 的 家 中 进行 这 些 活动 。 


通过 在 网 上 做 这 些 事 情 ， 我 们 会 增加 对 人 们 行为 和 偏好 的 了 解 。 
当 我 们 浏览 网 站 时 ， 我 们 的 行为 通常 会 被 存储 ， 在 许多 情况 下 ， 它 会 
被 用 于 改变 那些 随后 访问 网 站 的 人 的 体验 。 例 如 ， 当 你 在 亚马逊 上 写 
下 对 一 件 产 品 的 反 饶 ， 它 可 能 会 影响 该 产品 在 亚马逊 的 页 面 列表 中 出 
现 的 排序 。 当 你 在 网 飞 上 给 一 部 电影 打分 ， 它 可 能 会 影响 到 这 部 电影 
是 否 会 被 推荐 给 别人 。 


在 本 书 的 这 一 部 分 ， 我 们 将 探讨 亚马逊 产品 排序 背后 的 理念 〈 第 


6 章 ) ， 网 飞 如 何 推荐 电影 《第 7 章 ) ， 以 及 人 们 如 何在 慕 课 中 互相 学 
习 (第 8 章 ) 。 这 些 应 用 运作 的 核心 是 “群众 智慧 ”的 概念 ， 意 思 是 
随 着 人 群 数量 增加 《〈 即 关于 产品 或 项 目的 更 多 信息 被 收集 ) ， 人 们 的 
集体 决策 会 更 好 〈 即 对 产品 或 项 目 质量 的 估计 更 准确 ) 。 然 后 ， 在 第 
四 部 分 ， 我 们 将 转向 群众 不 那么 明智 的 方面 。 


在 这 段 进 入 社交 网 络 的 旅程 开始 之 前 ， 我 们 要 提醒 你 ， 对 这 些 类 
型 的 网 络 建 模 总 体 上 棘手 得 多 ， 模 型 与 现实 之 间 有 巨大 差距 。 在 第 三 
和 第 四 部 分 ， 我 们 必须 注意 模型 解释 和 预测 能 力 及 其 基本 假设 的 局 限 
性 。 同 时 ， 我 们 必须 对 “平均 ”和 “概率 ”等 术语 的 潜在 混用 提高 和 
感度 。 


第 6 章 
合并 产品 评级 


无 论 是 鞋 、DVD、 教 材 还 是 其 他 商品 ， 越 来 越 多 的 零售 购物 通过 互 
联网 进行 。2014 年 ， 人 们 在 网 上 购物 中 花费 了 总 计 1.3 万 亿美 元 ， 这 大 
约 是 当时 零售 市 场 总 额 的 6%， 并 且 可 能 有 更 大 的 增长 空间 。 到 2018 
年 ， 这 一 支出 预计 将 翻番 。 面 对 这 么 多 可 供 选择 的 产品 和 项 目 ， 给 客户 
提供 有 力 的 “质量 提示， 以 指导 他 们 的 决策 ， 是 网 上 零售 取得 成 功 的 关 
键 。 


注 消 电子 商务 的 “ 河 ” 


美国 最 大 的 电 商 公司 是 亚马逊 (图 6-1) 。 亚 马 进 网 上 书店 由 杰 夫 : 
贝 佐 斯 于 1994 年 创立 ， 该 公司 最 初 追求 相当 不 寻常 的 商业 模式 ， 直 到 世 
纪 之 交 才 开始 备 利 。 虽 然 其 最 初 增长 缓慢 ， 但 在 互联 网 泡沫 破裂 后 ， 亚 
马 逊 是 少数 几 个 生存 下 来 的 电子 商务 公司 之 一 。 事 实 上， 在 此 后 不 久 ， 
该 公司 于 2001 年 第 四 季度 首次 实现 僵 利 。 


QiTiQcOfi 
ee 


今天 ， 亚 蕊 还 的 收入 每 年 部 在 增加 ， 从 衣服 和 鞋子 到 软件 和 电子 设 
备 ， 任 何 产 品 都 可 以 从 其 网 站 上 购买 。 你 甚至 可 能 就 是 从 那里 买 的 本 


书 ! 


亚马逊 的 服务 也 延伸 到 电子 商务 之 外 。2007 年 ， 该 公司 开始 生产 目 
己 的 电子 图 书 阅读 器 Kindle 〈 我 们 在 第 3 章 智能 数据 定价 的 讨论 中 提 到 
过 ) 。3 年 后 ， 亚 马 逊 宣布 ，Kindle 的 销量 已 经 超过 其 网 站 的 精装 书 销 


三 


里。 


多 年 来 ， 街 边 的 实体 零售 商 与 顾客 面对面 交易 ， 他 们 和 亚马逊 等 网 
上 零售 商 之 间 有 明显 区 别 。 后 来 ， 许 多 商店 零售 商 进行 扩张 ， 开 始 利用 
新 兴 的 电子 商务 行业 。 一 个 典型 的 例子 是 沃尔玛 ， 它 是 最 大 的 实体 零售 
商 ， 同 时 一 直 在 网 上 零售 隘 中 排名 前 五 。2012 年 ， 亚 号 还 来 自在 线 销 售 
的 收入 仍 超过 沃尔玛 8 倍 ， 如 图 6-2 所 示 。 同 年 第 二 季度 ， 据 估计 ， 亚 马 
进 网 站 的 访问 量 达 到 1 亿 人 次 ， 超 过 沃尔玛 一 倍 。 
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亚马逊 史 泰 博 苹果 沃尔玛 自由 互动 
图 6-2 五 大 在 线 零售 商 2012 年 线 上 销售 总 收入 


那么 ， 亚 马 进 为 何如 此 成 功 ? 除了 它 的 许多 功能 〈 例 如 广泛 的 选 
择 ， 某 些 情 况 下 的 两 日 免费 运送 ) 和 有 竞争 力 的 价格 ， 使 该 网 站 吸引 人 
的 一 部 分 原因 是 ， 它 有 一 个 让 顾客 提供 反馈 的 机 制 ， 通过 产品 评论 。 亚 
马 还 将 汇总 对 茶 件 产品 的 评价 ， 形 成 一 个 数字 ， 即 平均 星 级 评分 ， 使 消 
费 者 了 解 产 品 的 “质量 ”。 在 本 章 ， 我 们 将 探讨 亚马逊 等 在 线 零售 了 商 可 以 


使 用 的 汇总 意见 的 方法 ， 并 以 此 确定 显示 给 消费 者 的 产品 列表 顺序 。 


你 相信 平均 评级 吗 ? 


假设 你 在 亚 马 进 选 购 一 合 新 的 高 清 电 视 。 在 浏览 搜索 结果 列表 后 ， 
你 最 终 根据 价格 将 搜索 范围 缩小 到 两 个 ， 如 图 6-3 所 示 。 


东芝 32C120U 32 英寸 720p 60Hz 液晶 高 清 电视 ( 黑色 ) 松下 VIERA TC-L32C5 32 英寸 720p 60Hz 液晶 高 清 电视 
全 新 : 379.99- 美 元 249.99 美元 起 全 新 :249-99 美 元 点 击 查看 商品 详情 

47 件 全 新 249.99 美元 起 15 件 全 新 及 非 全 新 219.95 美元 起 

14 件 非 全 新 201.95 美元 起 19 小 时 内 下 单 并 选择 单 日 配送 ，10 月 8 日 周一 可 送 达 

19 小 时 内 下 单 并 选择 单 日 配送 ，10 月 8 日 周一 可 送 达 食 食 食 食 从 回 (8) 

食 食 食 食 六 回 (95) 可 享受 免费 配送 

可 享受 免费 配送 商品 描述 :“……C5 ( 32 英寸 级 ) 是 720p 液 晶 高 清 电 视 


商品 描述 :“ 东 芝 32C120U 32 英寸 720p 60Hz 液晶 高 清 电 视 ” 【 冷 阴 极 背 光 ) …… 
图 6-3 亚 马 进 上 的 两 台 高 清 电视 列表 


注 : 右 侧 商品 平均 评级 较 高 ， 为 4.5 星 ， 而 左 侧 商品 为 4 星 。 但 左 侧 商品 的 评分 人 数 
更 多 ， 为 95 人 ， 右 侧 商品 为 8 人 


应 该 选择 哪 一 个 ? 乍 一 看 ， 右 边 的 似乎 是 更 好 的 选择 ， 因 为 它 有 更 
高 的 评级 : 4.5 星 。 


我 们 漏 掉 了 什么 吗 ? 让 我 们 想 想 这 些 数字 是 如 何 确定 的 。 亚 蕊 还 允 
许 顾 客 对 其 购买 产品 发 表 评 论 。 这 些 评论 包括 三 个 部 分 : 


1， 评级， 也 就 是 所 给 的 星 级 数 《 即 1、2、3、4 或 5) 
2. 文字 评论 ， 这 解释 了 为 什么 给 某 个 评级 ; 
3. 说 明 有 多 少 人 认为 该 评论 “有 用 ”的 提示 。 


东 件 商品 的 所 谓 平 均 顾 客 评价 〈 也 融 是 图 6-3 中 的 4 和 4.5) 是 所 有 
顾客 对 商品 的 平均 评级 。 它 试图 总 结 评论 者 的 意见 ， 并 采取 单一 数字 的 
形式 。 对 于 大 多 数 没有 时 间 逐 一 阅读 评论 的 人 来 说 ， 这 是 有 帮助 的 。 但 
我 们 考虑 这 个 总 结 评级 时 ， 是 否 应 该 天 注 给 出 评级 的 人 们 ， 考 虑 他 们 的 
个 人 声誉 和 所 发 表 评 论 的 总 数 ? 


剖析 平均 数 


在 图 6-3 中 ， 有 8 人 为 右边 的 高 清 电视 评级 ， 而 有 95 人 为 左边 的 评 
级 。 这 对 平均 顾客 评价 有 什么 意义 ? 直观 地 说 ， 如 果 更 多 的 人 对 一 件 商 
品 发 表 评论 ， 那 么 他 们 的 平均 评级 就 更 值得 信赖 ， 它 更 不 容易 受到 有 过 
严 〈 即 发 表 比 其 他 人 评分 较 低 的 评论 ) 或 过 宽 ( 即 发 表 比 其 他 人 评分 较 
高 的 评论 ) 倾向 者 的 影响 ， 也 不 容易 受 没有 用 过 产品 的 人 随机 发 表 的 评 
论 的 影响 。 要 理解 这 点 ， 假 设 一 件 产品 已 获得 一 个 3 星 评论 。 如 果 有 人 
决定 随机 输入 5， 平 均 评级 将 变 为 : 

3+5 
2 


4 


这 整整 有 一 星 的 差异 。 如 果 一 开始 有 101 个 3 星 评论 ， 然 后 如 果 有 人 
随机 输入 5， 平 均 评级 只 会 变 为 : 


10L 33 _ 


3.02 


保留 小 数 点 后 一 位 〈 这 是 亚马逊 的 做 法 ) ，3 星 的 平均 评级 会 保持 
不 变 。 


显然 ， 并 非 所 有 的 5 星 评价 都 过 于 宽松 ， 也 不 是 所 有 的 1 星 评价 都 太 
苛刻 。 这 些 评论 实际 上 对 购物 者 很 用。 事实 上 ， 亚 马 进 在 视觉 上 突出 
关于 其 产品 “最 有 帮助 ”的 正面 和 “最 有 帮助 ”的 负面 评论 ， 从 而 对 比 人 们 
总 体 上 认为 最 有 帮助 的 极端 评论 。 你 可 以 在 图 6-4 中 看 到 一 个 例子 : 两 
个 评论 的 星 级 数 差 别 很 大 〈4 : 1) ， 但 从 认为 其 有 帮助 的 人 数 来 看 ， 两 


个 评论 都 受到 欢迎 。 


| 最 有 帮助 的 好 评 最 有 帮助 的 差 评 
106 人 中 有 104 人 认为 以 下 评论 有 用 533 人 中 有 $02 人 认为 以 下 评论 有 用 
友人 六 电视 不 错 ， 但 算 不 上 特别 好 广 AAAA 在 2012 款 中 ， 他 们 减少 了 2011 同 款 中 的 很 
LG 的 中 低 端 电视 有 游戏 延迟 低 、 颜 色 准 确 度 高 和 在 相 多 功能 
同 甚 至 更 高 价格 水 平 的 电视 里 功能 和 画面 选择 最 广泛 在 2012 款 中 ， 他 们 减少 了 2011 / 2010 同 款 中 的 很 多 
的 名 声 。CS560 系列 在 这 些 方面 仍然 能 做 到 ， 但 表现 ”功能 。 原 因 不 清楚 。 我 想 只 是 为 了 赚 更 多 的 钱 ， 从 顾 


不 如 以 前 的 型 号 。 客 身上 薄 到 更 多 羊毛 。 他 们 删除 了 这 么 多 使 这 款 电 视 
如 此 齐 越 的 功能 ， 但 价格 保持 不 变 ， 而 且 我 觉得 这 个 
电视 造型 和 质量 整体 上 非常 好 。 人 


价格 已 经 很 高 了 。 
图 6-4 亚马逊 突出 关于 其 产品 最 有 帮助 的 好 评 和 差 评 
不 过 ， 我 们 可 能 会 猜测 ， 一 件 产 品 有 越 多 评论 ， 平 均 评 级 越 可 能 值 
得 信赖 。 所 以 再 看 看 图 6-3， 我 们 不 能 马上 就 说 ， 基 于 8 个 评分 的 4.5 星 
平均 顾客 评级 比 基 于 95 个 评分 的 4 星 平均 顾客 评级 更 好 。 


评论 可 靠 性 
评论 也 许 是 不 可 信 的 。 然 而 ， 它 们 在 我 们 生活 中 的 许多 方面 都 很 重 


从 网 上 购买 各 种 商品 ， 到 前 雇主 写 的 推荐 信 ， 再 到 学 生 写 的 课程 评 
。 要 提高 评论 的 可 靠 性 ， 需 要 采取 什么 方法 ? 


写 烟 


一 方面 ， 我 们 需要 和 星 选 出 “ 差 ? 的 评级 方法 。 芭 止 人 们 匿名 评论 和 限 
制 每 人 对 每 件 商 品 发 表 一 个 评论 都 是 很 好 的 开端 。 如 果 亚 马 逊 没有 这 些 
机 制 ， 结 果 会 怎样 ? 如 条 鲍 动 在 亚马逊 销售 产品 ， 他 可 以 对 目 己 的 商品 
和 输入 许多 好 评 ， 来 提高 自己 的 平均 顾客 评价 ， 并 且 每 次 都 是 匿名 及 表 ， 
这 样 就 没有 人 会 知道 他 在 给 目 己 刷 评 分 。 此 外 ， 如 果 他 发 现 东 件 产品 与 
目 己 的 产品 竞争 销售 ， 他 可 以 对 其 输入 大 量 差 评 。 即 使 采取 这 两 种 电 选 
方法 后 ， 还 需要 考虑 许多 其 他 低 质 量 的 评级 来 源 。 例 如 ， 你 可 以 随机 输 
入 与 产品 无 关 的 评论 〈 如 含有 自己 网 站 的 链接 ) 。 


因此 ， 在 考虑 其 他 问题 之 前 ， 我 们 需要 检查 用 于 输入 评论 的 机 制 。 
谁 能 发 表 评 论 ? 顾客 在 多 大 程度 上 被 鼓励 发 表 评论 ? 你 需要 先 购买 产 

品 ， 然 后 才能 评论 吗 ? 刚 创建 账户 的 人 可 以 发 表 评 论 吗 ? 此 外 ， 进 行 评 
价 能 输入 的 数字 范围 是 多 少 ? 例如 ， 人 们 注意 到 ，1~10、1~3 和 1~5 的 范 


围 会 引起 不 同 的 心理 反应 。 


这 些 因 素 提 出 了 环 手 的 问题 ， 评 价 没 有 唯一 “正确 ”的 答案 ， 而 是 取 
决 于 正在 评论 的 产品 类 型 : 电影 〈 如 互联 网 电影 数据 库 ) 评论 非常 主 
观 ， 电 子 产 品 《 如 亚马逊 ) 则 相对 客观 得 多 ， 而 酒店 《如 猫 途 麻 )》 和 和 餐 
厅 《〈 如 Yelp) 则 介 于 两 者 之 间 。 它 们 还 取决 于 评论 者 的 质量 : 例如 ， 亚 
马 逊 通过 上 发布“ 最 佳 评 论 者 排行 榜 *， 对 提交 有 用 评论 的 人 进行 奖励 。 如 
果 菏 个 评论 者 全 年 排名 较 高 ， 将 和 被 提升 到 “名 人 符 ”。 在 这 个 类 别 中 的 人 
应 该 会 得 到 更 多 信任 。 不 过 ， 信 誉 很 难 进行 量化 。 


面 对 这 些 挑战 ， 你 可 能 会 认为 汇总 意见 不 太 可 能 有 效 。 但 也 有 明显 
的 例外 。 


三 个 吴 皮 匠 赛 过 诸 贸 完 


早 在 1906 年 ， 英 国 普 利 订 斯 的 一 座 农场 举行 了 一 场 有 趣 的 比赛 。 在 
一 场 家 弟 展 览 会 上 ， 一 头 公 牛 被 展 出 ， 村 民 们 负责 猜测 它 的 体重 。787 
个 参与 者 中 ， 每 个 人 都 仔细 观察 了 这 头 牛 ， 然 后 在 一 张 纸 上 写 下 目 己 的 
估 测 结果 ， 中 间 没 有 和 任何 人 交流 〈 图 6-5) 。 


图 6-5 


注 : 1906 年 ， 一 头 牛 在 英国 的 一 座 农场 里 展 出 ， 大 约 有 800 名 村 民 试图 猜测 它 的 重 
量 。 虽 然 每 个 人 的 估 值 都 相差 其 远 ， 但 所 有 舍 值 的 平均 值 和 正确 答案 仅 相 差 1 磅 

弗 归 西 斯 -高 尔 顿 一 士 是 当时 著名 的 统计 学 家 ， 负 责 统计 结果 。 竺 
一 看 ， 他 看 到 五 花 八 门 的 数字 ， 从 非常 低 到 非常 高 ， 其 中 没有 一 个 数字 
是 真正 的 重量 1 198 磅 = 。 但 值得 注意 的 是 ， 当 他 计算 出 所 有 估 测 结果 
的 平均 值 后 ， 结 果 是 数字 1 ”197 磅 ， 与 真实 数值 相差 不 到 0.1%。 即 使 中 
位 数 〈 所 有 数值 中 间 的 数字 ) 1 207 磅 与 真实 数值 相差 也 不 到 0.8%。 


既然 每 个 人 的 佑 测 结果 彼此 相去 甚 远 ， 为 什么 简单 的 平均 值 却 能 如 
此 接近 真实 数值 ? 有 几 个 关键 因素 发 挥 作 用 ， 使 平均 值 如 此 准确 。 首 
先 ， 任 务 相 对 容易 : 猜测 牛 的 体重 有 客观 的 答案 ， 包 含 明 确 的 数字 意 
义 。 此 外 ， 估 测 是 公正 的 : 每 个 人 都 仔细 观 罕 了 和牛 ， 所 以 没有 猜 调 太 低 
或 太 高 的 系统 倾 回 。 妇 外 ， 估 测 是 独立 的 : 没有 村 民 看 到 其 他 人 的 数 
字 ， 所 以 没有 人 受到 其 他 人 的 影响 (类 似 于 密封 招 卖 原 理 ， 见 第 4 
章 ) 。 最 后 ， 有 不 少 人 参加 猜测 活动 。 


这 些 因素 是 高 尔 顿 显著 结果 的 核心 ， 但 每 一 个 因素 在 评论 创作 中 只 
在 不 同 程度 上 存在 。 


群众 的 智 意 


现在 回 到 亚 马 进 ， 我 们 的 希望 是 ， 当 我 们 将 顾客 对 产品 的 评级 进行 
平均 ， 结 果 将 接近 正确 的 评级 。 但 我 们 能 说 “正确 ”的 评级 存在 吗 ? 这 是 
人 否 至 少 取决 于 具体 顾客 (例如 ， 茶 一 系列 T 恤 可 能 对 一 个 人 有 吸引 力 ， 
但 对 男 一 个 人 没有 吸引 力 〉)? 一 般 来 次， 正如 我 们 在 高 尔 顿 的 实验 中 看 
到 的 ， 有 三 个 因素 是 汇总 个 人 意见 时 需要 考虑 的 : 


。 任务 定义 : 一 个 定义 明确 、 目 的 清晰 一 致 的 任务 (例如 猜 数 
字 ) 更 适合 于 意见 汇总 。 

。 独立 和 无 偏见 的 观点 : 意见 汇总 的 成 功 不 是 取决 于 许多 可 能 
猜测 正确 的 聪明 人 ， 而 是 取决 于 每 个 人 独立 于 他 人 的 公正 看 法 。 

。 人 数 : 如 果 参 与 人 数 较 少 的 话 ， 高 尔 顿 的 实验 也 不 会 如 此 有 


对 亚马逊 上 的 产品 进行 评论 定义 明确 吗 ? 不 完全 。 对 于 哪些 因 系 构 
成 评级 中 的 一 颗 星 ， 观 点 因 人 而 异 。 亚 马 进 的 评论 是 相互 独立 的 吗 ?” 有 
一 点 儿 。 即 使 你 在 输入 目 己 的 评论 前 ， 可 以 看 到 现 有 的 评论 ， 通 间 你 的 
评级 也 不 会 受到 太 多 影响 。 但 有 时 一 件 商品 的 评论 是 对 最 近 评 论 的 回 
应 ， 以 有 反 驶 或 加 强 这 些 观点 (这 十 序 员 决 朱 的 一 个 例子 ， 我 们 将 在 第 四 
部 分 具体 讨论 ) 。 一 般 来 说 ， 任 务 越 不 明确 ， 评 论 越 不 独立 ， 我 们 就 需 
要 更 多 “猜测 ”来 获得 可 信 的 平均 值 。 如 果 我 们 有 适当 的 机 制 来 检测 不 一 
致 或 低 质 量 的 评论 ， 就 可 以 减少 所 需 人 数 。 


当 这 三 个 因素 都 实现 时 ， 意 见 汇总 效果 极 好 。 比 如 说 ， 有 1 ”000 个 
人 在 玩 一 个 “ 猜 谈 ”游戏 ， 游 戏 有 清晰 明确 的 任务 。 最 后 ， 我 们 收集 每 个 
预 估 数 值 并 进行 平均 。 事 实证 明 ， 我 们 可 以 在 数学 上 预计 ， 相 比 每 个 单 
独 预 佑 数值 的 预期 误 痊 ， 该 平均 值 的 误 兰 将 减少 1 000 倍 : 


各 估 值 预期 误差 
人 数 


平均 值 预期 误差 们 


前 提 是 所 有 估 值 均 是 独立 的 。 

这 个 等 式 把 我 们 目前 讨论 的 内 容 体现 为 数学 形式 群众 的 智慧 
(wisdom of crowds) 。 只 要 每 个 人 都 独立 地 猜测 ， 并 且 不 带 任何 
系统 性 偏差 ， 我 们 可 以 预计 ， 他 们 作为 一 个 群体 的 “集体 预测 ”的 准确 性 
将 与 人 数 成 比例 提高 〈 图 6-6) 。 所 以 ， 如 果 有 5 人 ， 准 确 性 将 提高 5 
倍 ， 如 果 有 10 人 ， 将 提高 10 倍 ， 以 此 类推 群众 是 明智 的 ， 即 使 其 中 没 
有 任何 一 个 人 能 如 此 明智 。 在 图 6-7 中 ， 你 可 以 看 到 一 个 将 此 原理 应 用 


于 五 人 组 预测 的 示例 。 
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许多 人 的 综合 知识 将 超越 个 人 或 少数 人 的 能 力 
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注 : 基于 群众 的 智慧 ， 


| DODDD 


只 人 


-一 _ 5 人 
平均 值 = 3/1=3 平均 值 = (3+2+3+4+4)/5=16/5=3.2 
误差 = 误差 二 “1/5=0.2 

图 6-7 


注 : 我 们 从 左边 的 一 个 人 开始 ， 其 预期 误差 是 1。 当 增加 到 五 人 ， 平 均值 3. 2 的 误差 
预计 将 减少 5 倍 ， 前 提 是 每 个 人 的 估 值 都 是 独立 和 公正 的 

此 时 ， 你 可 能 有 两 个 关于 这 个 方程 的 问题 。 首 先 ， 为 什么 会 有 %， 
而 不 是 等 号 ? 这 意味 着 两 者 关系 是 约 等 ， 而 不 是 完全 相等 ， 部 。 
人 人 半天 而 二 了 《更 多 信息 ， 请 参考 本 书 网 站 Q6.1 部 分 ) 。 
二 ， 我 们 说 的 “误差 ?到 底 指 什么 ? 这 ae 
预测 值 和 实际 值 之 间 的 差异 ， 而 是 指 这 个 差 值 的 平方 。 我 们 将 在 第 7 章 
具体 讨论 平方 误差 。 


汇总 评级 很 难 


is 之 前 的 讨论 是 否 意味 着， 平均 
评级 将 接近 我 们 想 要 的 “真相 ”? 不 一 定 。 我 们 只 是 指出 了 一 些 复杂 的 问 
题 ， 比 如 观点 不 《完全 ) 独立 。 


其 他 困难 也 会 产生 。 回 到 图 6-3， 例 如 ， 有 两 全 价格 接近 的 高 清 电 
视 机 ， 平 均 评级 不 同 : 东芝 电视 机 为 来 自 95 次 评分 的 4 星 ， 而 松下 电视 
机 为 来 目 8 次 评分 的 4.5 星 。 顾 客 面临 权衡 ， 要 么 选择 具有 较 低 平均 评级 
和 较 大 评分 人 数 的 产品 ， 要 么 选择 有 较 高 平均 评级 和 较 小 评分 人 数 的 产 


口 
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即使 两 个 产品 有 类 似 的 平均 评级 和 评分 人 数 ， 评 级 分 布 也 可 能 会 有 
所 不 同 。 例 如 ， 图 6-8 中 的 两 款 手 电位 的 平均 买 家 评分 均 为 4.5 星 ， 且 评 
分 数量 接近 。 而 65% 的 人 给 美光 手电 人 简 5 星 ，89% 的 人 给 1 星 ; 62% 的 评分 
者 给 菲尼克斯 手电 简 5 星 ，29% 的 人 给 1 星 。 因 此 ， 美 光 的 高 分 和 低 分 比 
例 均 较 高 。 较 大 的 变量 使 平均 评级 更 值得 信赖 ， 还 是 更 值得 怀疑 ?这 是 
一 个 主观 问题 ， 没 有 明确 的 答案 。 


买 家 评论 
美光 M2A106 五 号 电池 迷你 手电 简 ， 银 色 


260 条 评论 平均 买 家 评论 
5 呈 : 国 (169) CN 
4 星 : 图 (41) 与 其 他 买 家 分 享 你 的 想法 
3 星 : (18) 
2 星 : | (12) 创建 你 的 评论 
1 星 : | (20) 


买 家 评论 
菲尼克斯 E01 微型 LED 手 电 简 


183 条 评论 平均 买 家 评论 
5 星 ， 国 于 到 (114) 让 人 龙 食 人 娘 丰 183 杀 天 冢 评论 
4 时 : 图 (45) 与 其 他 买 家 分 享 你 的 想法 
3 星 : (15) 
Sa | (5) 创建 你 的 评论 
1 星 : | (4) 
图 6-8 


注 : 亚马逊 销售 的 两 种 手电 简 ， 平 均 评分 和 评分 人 数 相似 ， 但 评分 变化 情况 不 同 


最 后 ， 产 品 获得 的 评级 可 能 会 随时 间 波 动 。 例 如 ， 在 图 6-9 中 ， 你 


可 以 看 到 亚马逊 上 某 件 产品 60 个 最 近 评级 和 60 个 最 有 用 的 评级 随时 间 而 
变化 的 对 比 情况 。 最 近 评 级 的 平均 值 为 3.6， 大 大 低 于 最 有 帮助 的 评级 
平均 值 (4.4) 。 最 近 评 级 反映 了 真正 的 变化 (如 产品 的 一 个 新 缺陷 ) 

或 只 是 正常 波动 ? 哪个 更 适合 作为 平均 买 家 评价 ?” 同样 ， 这 些 问 题 的 答 
案 是 主观 的 ， 对 汇总 意见 提出 了 另 一 个 挑 碾 。 


最 近 最 有 帮助 
5 5 
4 4 
党 这 
注 3 由 3 
py/ 
| 1 

时 间 时 间 

图 6-9 


注 : 图 为 亚马逊 某 产 品 最 近 〈 左 ) 和 最 有 帮助 的 〈 右 ) 评级 之 间 的 比较 


找到 一 个 “好 ?排名 方法 


在 第 二 部 分 ， 我 们 讨论 了 谷歌 用 来 排列 项 目 列表 的 不 同方 法 。 亚 马 
进 等 电子 商务 公司 也 有 排名 列表 〈 即 指定 类 别 的 产品 列表 ) 的 方案 ， 以 
帮助 买 家 高 效 浏 览 大 量 项 目 。 我 们 将 介绍 其 中 一 种 方法 ， 它 被 称 为 贝 叶 
斯 排名 ， 并 且 在 实践 中 已 被 广泛 采用 。 然 而 ， 亚 马 逊 并 没有 透露 目 己 的 
排名 算法 细节 。 


简单 平均 


表 6-1 显 示 了 亚马逊 的 五 台 DVD 播 放 机 的 评级 。 每 个 类 别 中 的 星 数 
和 评论 总 数 均 己 给 出 。 让 我 们 移 用 这 些 数字 来 计算 亚马逊 显示 的 每 个 产 
品 的 平均 评级 。 


如 何 做 到 这 一 点 ?我 们 把 所 有 星 数 相 加 ， 除 以 评论 总 数 。 对 于 松 
下 ， 有 5 个 5 星 评级 ， 共 有 5x5 = 25 颗 星 ;， 3 个 4 星 评级 ， 共 有 4x3 = 12; 3 
个 3 星 评级 ， 共 有 3x3 = 9; 没有 2 星 或 1 星 评 级 。 所 有 星 数 是 25+12+9 = 
46， 评 论 总 数 是 5+ 3+ 3 = 11， 所 以 平均 为 46 /11 = 4.182。 


其 他 四 件 商品 呢 ? 你 可 以 遵循 相同 的 程序 ， 得 到 以 下 结 


索尼 ]8x3+9x4+3x3+2x2+3x1l 148 

/GG: = 一 一 三 :过 
8 中 5sE 2 十 3 37 

飞利浦 : 23x31+ x4+ Hx3+ Sx21+ Bx1 534 
23+ | 导 十 二 总 二 中 67 

入 + + + + 

柯 蒂 斯 18X5+ 14x4+ 2x3+6x2+ 11x1_ 175_ ,4 
1]8+ 14+2+06+11 31] 

于 + 十 + 

东芝 ， lI9xS5S+ 10x4++ 10x3+4x2 llxil_ 184_, ,07 
19+ 10+ 10+4+ 1] 34 


如 采 把 它们 按 平 均 评 级 从 最 高 到 最 低 排 列 ， 顺 序 从 上 到 下 如 表 6-1 


所 示 。 
表 6-1 亚马逊 的 五 台 DVD 播 放 机 的 评级 


DVD 播放 机 5 星 4 星 3 星 2 星 1 星 共计 


松下 5 3 3 0 0 11 
索尼 18 9 5 2 3 37 
利 浦 23 15 11 5 13 67 
柯 带 斯 18 14 2 6 11 51 
东芝 19 10 10 4 11 54 
共计 83 51 31 17 38 220 


这 是 “正确 ”的 顺序 吗 ? 回 到 我 们 之 前 的 问题 : 如 果 一 个 产品 只 有 2 
个 评分 ， 即 使 都 是 5 星 ， 也 应 该 被 排 在 有 100 个 评分 ， 平 均 为 4.5 星 的 莞 
和 争 产 品 之 前 吗 ? 和 直观 地 说 ， 这 将 是 错误 的 ， 我 们 正面 临 这 个 问题 ， 松 下 


有 最 高 平均 评级 4.182， 但 评论 数 也 最 少 。 


贝 叶 斯 排序 原理 


我 们 如 何 将 不 同 数量 的 评论 纳入 考虑 ? 我 们 应 该 用 人 数 来 衡量 原始 
评分 。 知 道 评论 数量 使 我 们 提前 了 解 ， 我 们 可 以 对 其 加 以 利用 。 


因此 ， 除 了 将 每 个 产品 分 开 考虑 ， 让 我 们 把 所 有 相关 产品 的 信息 进 
行 整合 。 类 似 于 计算 每 个 产品 平均 评级 的 方法 ， 我 们 可 以 算出 所 有 产品 
的 总 平均 评级 。 结 果 是 什么 ? 如果 我 们 将 图 6-10 中 的 各 列 数字 相 加 ， 将 
得 到 每 个 星 级 的 总 数 ， 如 最 后 一 行 所 示 。 然 后 我 们 可 以 计算 : 
83x5+51x4+31x3+ 17x2+ 38x1 _ 784 


= 3.564 
53 二 31 主 31L 古 17 丰 38 220 


这 个 整体 平均 评级 基于 220 个 总 评级 。 直 观 地 说 ， 我 们 可 以 将 其 作 
为 每 个 单独 产品 的 备份 评级 。 一 个 产品 的 评级 越 多 ， 其 平均 评级 相对 于 
整体 平均 值 就 越 可 信 。 在 这 种 情况 下 ， 我 们 应 该 更 加 重视 个 别 评级 。 相 
反 ， 一 个 产品 的 评级 越 少 ， 其 平均 值 就 越 不 可 信 。 在 这 种 情况 下 ， 我 们 
应 该 倾向 于 相信 整体 平均 评级 。 


我 们 可 以 将 其 看 成 个 别 和 整体 之 间 的 “滑动 标尺 "”， 如 图 6-10 所 示 : 
调整 后 的 个 别 评级 位 于 两 者 之 间 。 对 于 每 个 产品 ， 调 整 值 可 以 通过 以 下 
公式 确定 : 


< 
调整 调整 
个 别 个 别 整体 个 别 个 别 
平均 值 平均 值 ”平均 值 平均 值 ”平均 什 


图 6-10 


注 : 调整 后 的 平均 评级 位 于 个 别 和 整体 平均 值 之 间 。 在 左边 的 情况 下 ， 产 品 的 个 别 
平均 值 小 于 整体 ， 在 右边 ， 个 别 平均 值 大 于 整体 


整体 数量 x 整体 平均 值 + 个 别 数量 x 个 别 平均 值 


整体 数量 + 个 别 数 量 


贝 叶 斯 排序 (Bayesian ranking) 是 贝 叶 斯 统计 方法 下 的 推理 方 
法 之 一 。 这 类 统计 法 以 英国 牧师 和 数学 家 托马斯 : 贝 叶 斯 命名 。 他 于 18 
世纪 中 期 发 现 其 基本 定理 的 一 个 特例 。 (主要 工作 实际 上 是 由 皮 埃 尔 - 
西蒙 . 拉 普 拉 斯 完成 ， 他 于 18 世 纪 末 再 次 独立 发 现 该 原理 ， 并 进行 延 
伸 。) 


有 趣 的 是 ， 在 整个 19 世 纪 和 20 世 纪 很 长 一 段 时 间 里 ， 贝 叶 斯 派 理论 
遭 到 所 谓 频 京 统 计 学 家 的 否定 甚至 强 烈 抵 制 。 他 们 倾 回 于 从 数据 中 做 出 
推 亲 和 佑 计 的 经 典 方 法 。 但 多 年 来 ， 贝 叶 斯 派 理 论 被 用 来 解决 一 些 频率 
统计 方法 无 法 攻克 的 重大 问题 。 这 里 有 几 个 历史 上 的 例子 : 


。 19 世 纪 90 年 代 ， 法 国 军 官 阿尔 弗 雷 德 。 德 雷 福 斯 被 诬陷 犯 下 
叛国 罪 ， 数 学 家 亨利 。 庞 加 菜 引 用 贝 叶 斯 定理 来 证 明 其 清白 。 

。 “二 战 ” 期 间 ， 英 国 计 算 机 先驱 阿兰 。 图 灵 使 用 贝 叶 斯 系统 
破译 德国 军 方 通信 密码 。 

。 20 世 纪 五 六 十 年 代 ， 哈 佛 和 艺 加 哥 的 研究 人 员 使 用 贝 叶 斯 派 
分 析 方 法 ， 表 明 有 争议 的 《联邦 党 人 文集 》 很 可 能 由 诬 姆 斯 。 麦 迪 
地 所 著 ， 而 非 亚 力 山 大 。 汉 密 尔 顿 。 


随 痢 时 间 的 推移 ， 这 些 成 功 的 例子 与 计算 技术 的 进步 逐渐 增加 了 贝 
叶 斯 建 模 的 接受 程度 。 到 21 世 纪 ， 它 已 被 广泛 接受 。 今 天 ， 它 被 用 于 机 
器 学 习 和 大 数据 分 析 等 领域 。 让 我 们 明确 一 点 : 贝 叶 斯 建 模 确实 有 其 风 
险 ， 但 它 揭 示 了 一 些 值得 讨论 的 群众 智慧 。 


假设 总 评级 数 为 100， 总 平均 值 为 2 星 。 如 果 其 中 一 个 产品 有 来 自 5 


个 评论 的 4 星 平 均值 ， 那 么 该 产品 的 贝 氏 评 级 是 什么 ? 利用 方程 ， 我 们 
得 到 : 
100x2+ 5x4 220 


= = 2.10 
100+5 105 


这 距离 2 比 距 离 4 近 得 多 。 这 是 有 道理 的 ， 因 为 个 别 评级 数 远 远 小 于 
总 评级 数 ， 所 以 我 们 更 依赖 后 者 。 相 反 ， 如 果 4 星 平均 值 基于 40 个 评 


论 ， 那 么 贝 氏 评级 将 上 升 到 : 
100x2+ 40x4 360 
100 + 40 140 


2 


这 已 远离 2 (图 6-11) 。 


2 1 
2.] ZI] 
束 妇 人 林 个 昂 
下 体 |- TE 个 别 
平均 值 下 均值 
5 条 评论 40 条 评论 
图 6-11 


注 : 在 我 们 的 例子 中 ， 评 论 数 从 5 增加 到 40， 会 使 调整 后 的 平均 值 从 2.1 变 为 2.57， 
更 接近 个 别 平 均值 100X2+40 X4=360=2. 57 

让 我 们 在 图 6-10 的 例子 中 应 用 贝 叶 斯 法 调整 ， 看 顺序 是 否 有 变化 。 
记得 总 评级 数 为 220， 我 们 计算 的 整体 平均 评级 为 3.564。 那 么 ， 松 下 播 
放 机 的 调整 值 是 多 少 ? 该 商品 有 11 个 评级 ， 其 个 别 平均 值 为 4.182， 通 
过 贝 叶 斯 公式 得 出 : 

220 x 3.564 + 11 x 4.182 784.08+ 46.002 
220+ 11 加 220+ 11 


= 3.,593 


经 过 贝 叶 斯 法 调整 后 ， 注 意 到 松下 的 评级 已 非常 接近 平均 值 3.564 
了 吧 ? 为 什么 ? 由 于 该 播放 机 评级 数 〈11) 相对 于 总 数 (220) 较 小 ， 
这 使 得 整体 平均 值 在 公式 中 的 权重 大 得 多 。 其 他 DVD 播放 机 的 计算 按照 


同样 方式 进行 : 


有 索尼: 220 x 3.564 + 37 x 4.000 784.08 + 148 


220 + 37 2201+37 362 
飞利浦 ， 220x 3.564 + 67 x 3.448 _ 784.08+ 231.016 _ ,537 
220 + 67 220 + 67 
何 基 斯 ，220* 3.564 + 51x 3.431 _ 784.08+ 174.981 _ ,39 
220+ 51 220+ 51 
,220x3.564 + 54x3.407 784.08+ 183.978 
A 220+ 54 = 


结果 是 什么 ? 现在 ， 按 照 贝 氏 评级 ， 产 品 排名 从 最 高 到 最 低 分 别 为 
索尼 、 松 下 、 柯 蒂 斯 、 飞 利 浦 和 和 东芝。 你 可 以 在 表 6-2 中 看 到 运用 贝 叶 
斯 排名 前 后 的 并 列 对 比 情况 。 经 过 贝 叶 斯 法 调整 后 ， 松 下 和 索尼 播放 
机 ， 以 及 飞利浦 和 柯 带 斯 播放 机 互相 交换 了 位 置 。 此 外 ， 所 有 评级 都 更 


接近 平均 值 。 
表 6-2 基于 原始 平均 值 和 贝 叶 斯 调整 值 的 DVD 播放 机 排名 比较 
DVD 播放 机 评级 数 
排名 评级 排名 评级 
松下 11 1 4.182 2 3.593 
索尼 人 2 4 1 3.626 
《 利 浦 67 3 3.448 4 5 
柯 蒂 斯 51 4 3.431 3 3.539 
东芝 54 5 3.407 5 3.533 
在 这 个 例子 中 ， 贝 叶 斯 法 调整 显然 改变 了 产品 顺序 。 但 调整 后 的 评 


级 不 会 在 所 有 情况 下 都 改变 顺序 。 你 能 想到 一 个 排名 保持 不 变 的 例子 
吗 ? 


实践 中 的 页 叶 斯 排序 


不 少 网 站 在 实践 中 采用 了 贝 叶 斯 排序 。 例 如 ， 互 联网 电影 数据 库 的 
250 佳 电影 列表 完全 遵循 之 前 的 方程 。 有 时 ， 最 好 对 用 来 调整 评级 的 “ 整 


体 数量 ”设置 最 大 值 。 随 着 时 间 的 推移 ， 所 有 产品 的 评级 总 量 将 保持 上 
升 ， 贝 叶 斯 调整 评级 的 数值 范围 将 变 得 越 来 越 小 。 最 终 ， 我 们 将 有 针对 
如 此 多 产品 的 如 此 多 的 评级 ， 以 至 于 每 次 使 用 该 方程 ， 基 本 上 都 会 默认 
采用 整体 平均 值 。Beer Advocate 的 啤酒 排名 

(http://beeradvocate.com/lists/popular) 为 了 避免 这 个 问题 ， 试 图 通过 选 
择 “ 整 体 数量 ”作为 需要 在 页 面 上 列 出 的 最 小 评论 数目 。 


在 本 部 分 讨论 中 ， 我 们 假设 产品 评级 有 单一 、 真 实 的 数值 ， 与 我 们 
期 望 它 对 顾客 的 符合 度 对 应 。 但 事实 上 ， 真 相 因 人 而 异 。 茶 些 产品 只 会 
产生 两 极 反 应 : 有 些 人 喜欢 ， 而 有 些 人 讨厌 。 你 可 以 在 图 6-12 中 看 到 亚 
马 进 上 索尼 DVD 播放 机 的 一 个 例子 : 一 方面 ， 大 多 数 人 给 它 4 星 或 5 星 评 
级 ， 另 一 方面 ， 有 的 人 给 1 星 ， 而 2 星 和 3 星 评级 则 不 常见 。 有 时 ， 只 有 
带 看 这 两 种 强烈 感受 之 一 的 人 才 愿 意 写 评论 。 这 样 的 评级 集合 被 称 为 遵 
循 多 重 模 态 分 布 “ 即 包含 许多 中 心 ) 。 虽 然 我 们 关注 单 峰 分 布 ， 但 贝 叶 
斯 分 析 也 可 以 扩展 到 多 重 模 态 的 情况 。 


买 家 评论 
索尼 DVP_SR200P/B DVD 播放 机 ， 黑 色 


529 条 评论 平均 买 家 评论 
5s 星 . | (281) 食 食 食 禄 529 条 买 家 评论 
4 国 (118) 与 其 他 买 家 分 享 你 的 想法 
3 星 : 上 (39) 
2 星 : | (18) 创建 你 的 评论 
1 星 疾 (73) 
图 6-12 


注 : 对 亚马逊 上 的 产品 产生 两 极 反应 的 例子 : 一 些 人 很 喜欢 ， 给 它 4 星 或 5 星 ， 而 其 
他 人 讨厌 它 ， 给 它 1 星 


最 后 ， 我 们 要 提醒 ， 贝 叶 斯 法 调整 只 适用 于 调整 可 比 产品 系列 的 评 


级 〈 如 一 组 DVD 播放 机 ， 一 组 笔记 本 电脑 )》。 它 不 能 简单 地 用 于 调整 不 
同 产品 的 评级 〈 如 任意 一 组 电子 产品 ) 。 将 一 组 对 象 作 为 整体 进行 评 
级 ， 需 要 有 一 个 使 调整 值 有 意义 的 整体 平均 值 。 


此 时 ， 你 可 能 会 想 知 道 : 亚马逊 具体 是 如 何 对 产品 列表 进行 排名 
的 ?它们 实际 上 按照 菜 一 个 秘密 公式 ， 将 平均 评论 与 至 少 三 个 其 他 因素 
结合 : 根据 评论 人 数 进行 由 叶 斯 法 调整 《如 我 们 在 本 部 分 的 讨论 ) ， 评 
论 的 新 旧 程 度 ， 以 及 评论 者 的 声 党 得分。 具体 公 邢 不 为 亚马逊 以 外 的 人 
所 知 ， 但 如 果 你 有 兴趣 阅读 关于 其 排名 如 何 确定 的 一 个 具体 例子 ， 请 参 
考 本 书 网 站 Q6.2 部 分 。 


到 目前 为 止 ， 我 们 已 经 看 到 ， 对 网 站 上 和 输入 的 评论 进行 评级 汇总 ， 
对 于 了 解 产品 的 “真相 ?是 有 用 的 。 和 群众 智 意 是 网 络 中 的 一 个 重要 原则 ， 
它 指 导 了 许多 组 合 人 们 意见 的 算法 设计 。 下 一 步 ， 我 们 将 关注 网 飞 的 电 
影 推 荐 ， 它 不 是 为 所 有 人 形成 一 个 评级 ， 而 是 为 每 个 人 都 预测 多 个 评 
级 。 


1. 1 磅 >0.45 千 克 。 一 ”编者 注 


第 7 章 
推 存 观 看 的 影 


继续 我 们 关于 意见 汇总 的 主题 ， 现 在 转向 推荐 。 从 广义 上 讲 ， 产 品 
推荐 利用 现 有 的 产品 评级 知识 ， 建 议 顾客 下 一 步 消 费 什 么 。 


如 果 你 是 网 飞 的 用 户 〈 图 7-1) ， 你 可 能 已 经 处 于 其 电影 推荐 的 接 
收 澳 。 它 们 如 何 确定 (它们 认为 ) 哪 些 是 你 最 有 兴趣 观看 的 影片 ?进行 
推荐 时 它们 需要 利用 已 有 的 关于 用 户 偏 好 的 数据 ， 来 预测 它们 没有 的 电 
影评 级 。 这 往往 假定 和 利用 群众 的 智慧 : 他 们 开始 时 拥有 的 评级 数 越 
多 ， 其 预测 结果 就 会 越 好 。 


图 7-1 网 飞 的 商标 标识 


大 规模 在 线 播放 电影 


在 1997 年 ， 兽 有 一 个 人 对 在 音像 店 积 素 的 大 笔 清 纳 金 感到 十 分 诅 


丧 。 他 所 认为 的 “逾期 ”是 一 种 新 的 收费 模式 : 与 其 每 次 租赁 时 问 人 们 收 
取 费 用 ， 何 不 按 月 同 他 们 收取 固定 费用 呢 ? 其 他 机 制 ， 如 同一 时 间 可 以 
租借 的 电影 数量 限制 ， 则 可 以 用 来 激励 人 们 归还 DVD。 


里 德 : 哈 斯 廷 斯 就 是 这 个 故事 的 主角 。 他 于 同年 成 为 网 飞 的 一 位 创 
始 人 。 网 飞 最 初 作为 传统 实体 DVD 出 租 店 ， 实 行 每 次 租赁 定价 收费 模 
式 。 随 着 电子 商务 开始 飞速 发 展 〈 在 第 6 章 提 到 过 )〉 ， 他 们 于 1998 年 创 
办 网 上 商店 ， 人 允许 人 们 在 线 购 买 DVD， 并 等 待 邮寄 送 达 。 然 后 ， 在 1999 
年 ， 他 们 引入 按 月 收取 会 员 费 的 模式 ， 顾 客 每 月 癌 网 飞 文 付费 用 ， 而 不 
古 每 次 租赁 时 付费 。 在 这 个 方案 下 ， 用 户 可 以 将 租 来 的 电影 保留 目 己 希 
望 的 时 间 长 度 ， 但 对 用 户 可 以 同时 借 出 的 数量 有 限制 。 


多 年 来 ， 网 飞 已 经 具有 展 好 的 用 户 可 扩展 性 和 用 性 。 可 扩展 性 意味 
大 网 飞 在 已 经 有 很 多 用 户 的 前 提 下 ， 获 得 一 个 新 用 户 的 成 本 大 大 下 降 。 
荞 性 意味 着 那些 已 经 使 用 网 飞 服务 的 用 户 往 往 会 继续 使 用 ， 而 不 是 改 用 
为 一 个 视频 提供 商 。 


到 2008 年 ， 在 美国 和 加 拿 大 约 有 900 万 名 网 飞 用 户 ， 这 个 数字 相 比 
世纪 之 交 时 增加 了 10 倍 。 大 约 从 这 个 时 候 起 ， 网 飞 转向 另 一 种 娱乐 提供 
形式 : 通过 互联 网 向 联网 设备 提供 流 媒体 电影 和 电视 节目 。 这 些 设备 包 
括 所 有 我 们 每 天 都 在 使 用 的 产品 : 电视 机 、 机 顶 盒 、 智 能 手机 、 游 戏 机 
等 。 这 种 形式 的 租赁 服务 已 经 在 很 大 程度 上 超越 传统 音像 店 ， 例 如 ， 百 
视 达 于 2010 年 申请 破产 ， 并 转向 邮件 投递 领域 。 


视频 流 使 网 飞 用 户 数量 扶 摇 直 上 ， 到 2015 年 达到 6 ”600 万 ， 比 2008 
年 增加 7 倍 多 。 目 前 ， 网 飞 公 司 是 美国 领先 的 视频 流 媒 体 服务 提供 商 。 
在 所 有 家 庭 中 ， 有 369% 订 阅 网 飞 服 务 ， 而 亚 马 进 和 Hulu Plus〈 两 者 是 网 
飞 最 大 的 竞争 对 手 ) 分 别 为 13% 和 6.59%。 有 趣 的 是 ， 网 飞 视频 流 在 2011 
年 3 月 产生 了 巨大 流量 ， 占 互联 网 所 有 数据 流量 的 14。 在 一 些 统计 数据 
中 ， 这 个 数字 更 高 。 


推荐 :“ 读 心术 ”游戏 


网 飞 提 供 耕 干 功能 来 帮助 你 选择 电影 。 在 进行 选择 前 ， 你 可 以 按 类 


型 过 滤 ， 按 评级 排序 ， 看 影评 家 的 选择 ， 参 考 网 飞 前 100 佳 影片 ， 等 
笠 
二 oo 


这 些 功 能 中 的 一 部 分 是 “一 思 切 ” 式 ， 对 你 和 对 别人 显示 的 内 容 一 
样 。 但 网 发 也 会 癌 你 推荐 它 认 为 你 会 喜欢 的 电影 。 好 像 它 在 读 你 的 心 ， 
在 你 观看 或 进行 评价 之 前 ， 就 预测 哪些 内 容 会 适合 你 的 口味 ! 


这 是 如 何 进行 的 ? 当 你 使 用 网 飞 时 ， 他 们 会 在 数据 库 中 建立 天 于 你 
的 行为 的 历史 数据 。 这 些 信息 被 输入 算法 ， 来 预测 你 将 如 何 给 其 他 电影 
评级 。 你 提交 评级 ， 添 加 电影 到 播放 队列 ， 或 者 告诉 网 飞 哪 些 是 你 不 感 
兴趣 的 ， 这 些 行为 都 会 影响 未 来 哪些 影 厂 将 被 推荐 给 你 。 


一 个 有 效 的 推荐 系统 (recommendation system) 对 于 网 飞 很 
重要 ， 因 为 它 改 进 了 用 户 体 验 ， 提 高 了 用 户 的 忠诚 度 ， 并 有 助 于 库存 控 
制 。 除 了 视频 分 配 ， 这 些 系 统 在 许多 其 他 应 用 中 也 很 重要 。 例 如 ， 在 第 
6 章 中 ， 我 们 谈 到 亚马逊 如 何 得 出 某 个 产品 的 平均 评级 和 排名 。 类 似 的 
做 法 是 亚马逊 如 何 根据 你 的 购买 和 浏览 历史 ， 向 你 推荐 产品 ， 并 在 你 每 
次 浏览 时 进行 调整 。 另 外 ， 在 第 9 章 中 ， 我 们 将 简要 介绍 YouTube 如 何 
在 你 观看 结束 时 ， 向 你 推荐 视频 。 


网 飞 公司 一 直 倡 寻 一 个 超越 传统 推荐 方案 的 系统 ， 利 用 其 收集 的 所 
有 用 户 行 为 的 丰富 历史 ， 建 并 档案， 记录 每 个 用 户 的 电影 品味 ， 以 及 用 
户 如 何 对 每 部 电影 评级 。 其 算法 发 现 电影 评级 “群众 ”提供 的 数据 中 隐藏 
的 模式 ， 并 以 此 建立 这 些 模型 。 让 我 们 仔细 看 看 这 个 系统 的 输入 和 输 
出 ， 如 图 7-2 所 示 。 


一 一 
和 a > 
图 7-2 
注 : 用 户 对 电影 的 已 知 评 级 被 输入 进 预 测 公 式 ， 然 后 将 输出 对 所 有 未 知 值 的 预测 


输入 


每 次 用 户 对 电影 进行 评级 ， 其 评级 束 会 被 存储 在 网 飞 的 数据 库 中 。 
这 些 数据 的 集合 构成 了 系统 的 输入 信息 。 每 个 评级 包含 四 组 数字 : 用 户 
号 份 、 电 影 编号 、 星 级 数量 《从 1 到 5) ， 以 及 评级 日 期 。 


这 个 输入 量 有 多 大 ? 非常 大 。 网 飞 有 超过 6 ”000 万 名 用 户 ， 加 上 75 
000 个 不 同 的 电影 标题 ， 共 有 超过 4 万 亿 (4 000 000 000 000) 组 可 能 的 
用 户 和 电影 评级 配对 。 当 然 ， 这 些 评 级 中 只 有 一 小 部 分 是 实际 存在 的 ， 
因为 只 有 一 小 部 分 用 户 看 过 某 部 电影 ， 其 中 又 只 有 一 部 分 愿意 给 它 打 
分 。 换 句 话 说， 这 个 数据 集 十 分 稀疏 ， 因 为 这 些 可 能 的 条 目 中 只 有 一 小 
部 分 是 真正 存在 的 《记得 我 们 在 第 5 章 说 过 网 络 图 是 稀 朴 的 ) 。 尽 管 如 
此 ， 数 据 库 中 输入 的 用 户 和 电影 评级 配对 总 数 仍然 达到 几 十 亿 。 


我 们 可 以 用 一 张 图 表 直 观 地 表示 这 些 输入 信息 ， 行 代表 用 户 ， 列 代 
表 电 影 ， 如 图 7-2 左 侧 所 示 。 对 于 表 中 的 每 个 元 素 ， 其 位 置 表示 (1) 哪 
个 用 户 ; (2) 哪 部 电影 ， 条 目 本 身 表示 ; (3) 星 级 评级 。 问 写 (? ) 
表示 未 知 评级 。 


这 些 输 入 信息 是 用 来 做 什么 的 ?它们 被 用 来 调整 系统 预测 算法 的 不 
同 参 数 。 你 可 以 把 参数 看 作 一 个 可 调 的 旋钮 或 按钮 ， 改 变 参数 的 值 〈 即 
转动 旋钮 ) 会 对 系统 输出 的 结果 产生 一 些 影响 。 输 入 数据 用 于 系统 的 训 
练 阶段 ， 将 参数 设置 为 期 望 产生 高 质量 输出 的 数值 。 


输出 


推荐 系统 会 输出 给 我 们 什么 ”首先 ， 输 出 是 一 组 预测 值 ， 表 示 用 户 
会 给 自己 还 没有 看 过 电影 的 评级 。 这 在 图 7-2 的 右 侧 显示 ， 其 中 图 左 侧 
的 问号 已 被 一 些 预 测 值 蔡 换 。 你 看 到 这 些 输出 值 包 含 小 数 〈 也 就 是 说 ， 
它们 不 只 是 1 到 5 之 间 的 整数 ) 。 我 们 如 何 进 行 解读 ?比如 说 ， 预 测 值 
4.2 介 于 4 和 5 之 间 ， 但 更 接近 4， 其 20% 靠 向 5，80% 靠 向 4。 所 以 我 们 可 
以 将 4.2 解 释 为 ， 用 户 有 20% 的 概率 会 给 这 部 电影 5 星 ， 有 80% 的 概率 会 


给 它 引 里， 


不 过 ， 这 些 预 测评 级 并 不 是 最 终 真正 显示 给 观众 的 形式 。 系 统 最 终 
输出 的 是 一 系列 推荐 给 个 人 用 户 的 简短 、 有 序 排列 的 电影 列表 。 我 们 如 
何 使 用 预测 ， 来 确定 推荐 给 每 个 用 户 的 列表 是 什么 ? 我 们 可 以 使 用 不 同 
的 标准 。 例 如 ， 我 们 可 以 推荐 用 户 还 没 看 的 预测 评级 最 高 的 5 部 电影 ， 
或 所 有 预测 评级 超过 4 星 的 电影 。 


评 佑 预测 


我 们 如 何 确定 这 种 系统 的 质量 或 性 能 ? 真正 的 检验 方法 是 ， 有 多 少 
用 户 真 的 喜欢 推荐 给 他 们 的 电影 。 但 是 这 个 信息 很 难 收 集 。 相 反 ， 我 们 
需要 一 些 可 以 作为 指标 的 度量 值 。 


如 果 除 了 对 我 们 未 知 的 评级 做 出 预测 ， 也 对 已 知 评级 做 出 预测 ， 结 
果 会 怎样 ? 那样 我 们 就 可 以 知道 ， 我 们 对 已 知 评级 的 预测 与 实际 数值 的 
匹配 程度 如 何 。 两 者 匹配 度 越 高 ， 我 们 对 未 知 评级 的 预 训 就 可 能 越 准 
确 。 这 种 思路 第 用 来 评估 以 下 类 型 的 系统 : 《〈1) 使 用 一 些 数据 来 调整 


系统 的 参数 ; 《〈2) 使 用 系统 来 预测 目标 值 (有 的 已 知 ， 有 的 未 知 ) ; 
(3) 比较 已 知 目标 的 预测 值 与 实际 值 ， 以 了 解 预 期 质量 。 


< 号 知 


一 -一 
i 


预测 


未 知 
图 7-3 

注 : 对 于 评估 ， 已 知 数据 〈 即 数据 库 中 已 有 的 评级 ) 被 分 成 两 组 : 一 组 用 于 训练 ， 
一 组 用 于 评估 

要 做 到 这 一 点 ， 我 们 必须 确保 将 训练 和 评价 中 使 用 的 数据 分 开 ， 如 
图 7-3 所 示 。 这 两 组 数据 都 是 已 知 的 ， 但 它们 必须 是 不 同 的 ， 因 为 我 们 
需要 测试 算法 预测 其 没有 见 过 的 评级 的 能 力 。 换 句 话 说， 在 训练 阶段 ， 
我 们 需要 隐瞒 (或 保持 ， 因 为 它 是 已 知 的 ) 来 自我 们 输入 系统 的 数据 的 
评价 等 级 。 


一 旦 我 们 将 预测 和 实际 评级 进行 比较 ， 如 何 确 定 质 量 ? 一 个 标准 方 
法 是 均 方 根 误差 (root mean square error) ， 缩 写 为 RMSE。 它 的 
定义 既 长 又 撩 口 : 找到 数据 集 上 所 有 点 的 误差 ， 将 其 平方 ， 找 到 均值 
《 即 平均 数 ) ， 并 计算 平方 根 。 我 们 也 可 以 参考 均 方 误 差 ， 这 节省 了 最 


后 一 步 “〈 平 方 根 ) 。 例 如 ， 将 数字 1、2 和 3 作为 三 个 值 的 误差 ， 将 其 平 
方 得 出 12=1x1=1，22=2x2=4，32=3x3=9。 平 均 数 为 ， 


十 4 十 
467 


这 是 均 方 误差 。 然 后 计算 平方 根 得 出 均 方 根 误差 : N4. 67 = 2.16。 
均 方 根 误差 (或 均 方 误差 ) 越 低 ， 系 统 输出 的 预期 质量 束 越 蜗 。 


在 对 评级 预测 算法 进行 具体 讨论 之 前 ， 让 我 们 看 看 它们 在 网 飞 的 历 
史上 发 挥 了 多 人 么 重要 的 作用 。 


网 飞 大 奖 寓 


网 飞 最 初 的 预测 算法 是 CineMatch。 意 识 到 拥有 最 好 的 评级 预测 算 
法 有 多 么 重要 后 ， 网 长 于 2006 年 10 月 推出 了 一 项 挑战 赛 。 这 场 公 开 、 在 
线 、 器 国 的 比赛 称 为 网 飞 奖 (Netflix Prize) ， 提 供 100 万 美元 奖金 给 
能 在 CineMatch 的 水 平 上 将 均 方 根 误差 改善 10% 的 团队 。 


比赛 开始 时 ， 网 飞 向 公众 公布 了 一 组 包括 1 亿 多 个 评级 的 数据 ， 这 
是 其 1999 年 到 2005 年 间 记 录 中 的 一 部 分 。 在 2006 年 ， 这 一 数据 量 可 以 装 
进 标准 台式 电脑 的 内 存 ， 使 世界 上 任何 人 都 能 轻松 参加 比赛 。 评 级 数据 
来 自 480 000 多 个 用 户 和 17 770 部 电影 。 平 均 每 部 电影 被 超过 5 000 个 用 
户 评级 ， 平 均 每 个 用 户 给 超过 200 部 电影 进行 过 评级 。 


这 个 数据 集 是 参赛 者 检验 其 算法 所 需 的 。 它 是 含有 足够 的 信息 来 为 
每 个 用 户 进 行 预测 ? 乍 一 看 ， 似 乎 如 此 。 进 一 步 分 析 后 ， 事 实证 明 ， 只 
有 少数 用 户 通 过 评估 大 量 电影 有 一 个 用 户 为 超过 17 000 部 电影 评级 ! 
) 将 这 个 平均 值 提高 全 200。 对 于 大 多 数 用 户 来 将， 只 有 少数 评级 ， 这 
对 汇总 用 尸 个 人 豆 好 构成 了 一 个 有 趣 的 挑战 。 


网 发 把 只 有 其 有 权 得 知 的 几 百 万 条 评级 从 训练 数据 中 提出 。 测 试 集 


中 的 140 万 条 评级 将 作为 最 终 的 评估 标准 ， 以 确定 获胜 者 。CineMatch 对 
测试 集 的 均 方 根 误差 为 0.952 5， 网 飞 为 参赛 者 定 的 目标 为 将 测试 集 的 均 
方 根 误差 降低 至 0.9x0.952 5 = 0.857 3。 这 似乎 没有 太 多 区 别 ， 但 是 哪怕 
将 均 方 根 误差 降低 0.01， 在 最 后 的 推荐 中 都 能 产生 显著 差异 。 


总 体 而 言 ， 这 场 比赛 激发 了 近年 来 推荐 系统 研究 方面 最 激烈 的 活 
动 。 全 球 5 000 多 个 团队 提交 了 超过 44 000 条 结果 。2006 年 10 月 ， 比 赛 开 
始 仅 一 周 ，CineMatch 就 被 打败 ， 但 直到 几乎 3 年 后 的 2009 年 6 月 ， 才 有 
团队 将 误差 水 平 改 善 了 10%。 最 后 ， 前 两 名 团队 ，The Ensemble 和 
BellKor’s Pragmatic Chaos， 对 测试 集 的 均 方 根 误 差 均 改善 了 10.06%。 由 
于 后 者 提交 算法 时 间 比 前 者 早 20 分 钟 ， 因 此 他 们 被 宣布 成 为 获胜 者 。 


关于 这 场 比 赛 的 进展 情况 和 对 数据 集 进行 训练 和 评价 分 区 的 更 多 细 
节 ， 请 参考 本 书 网 站 Q7.1 和 Q7.2 部 分 。 


建立 基线 预测 值 


对 于 网 飞 数据 集 的 均 方 根 误 兰 ， 要 取得 最 后 百 分 之 几 的 进步 ， 需 要 
将 很 多 算法 组 合 在 一 起 ， 将 成 千 上 万 个 模型 参数 调整 妥当 。 我 们 无 意 解 
释 这 些 程序 所 涉及 的 细节 。 相 反 ， 我 们 将 关注 最 初 环 市 中 的 两 步 : 基线 
预测 和 邻 式 模 型 ， 并 尽 可 能 简化 其 中 涉及 的 数学 概念 。 正 如 你 将 看 到 
的 ， 在 这 些 方法 内 部 是 这 样 的 概念 : 我 们 可 以 利用 已 有 数据 “ 群 ”中 的 信 
娠 ， 推 断 用 户 喜 好 和 电影 特征 ， 以 进行 预测 。 


我 们 的 数据 集 示例 


请 看 图 7-4 中 的 数据 集 示 例 。 它 包含 6 个 用 户 (A~F)〉 ， 每 行 一 个 ， 
以 及 5 部 电影 〈(IvV) ， 每 列 一 部 。 既 非 黑 体 也 非 问号 的 条 目 将 被 用 来 作 
为 训练 数据 ， 作 为 我 们 预测 的 基础 。5 个 黑体 条 目 将 作为 测试 数据 ， 这 


样 我 们 就 可 以 评估 我 们 对 此 数据 集 的 算法 性 能 。5 个 问号 是 系统 预测 的 
最 终 输出 。 


| IN Ml IV YV 


图 7-4 包含 6 个 用 户 (A~F) 和 5 部 电影 (1~V) 的 数据 集 示例 


显然 ， 比 起 网 飞 包含 数 百 万 名 用 户 和 数 万 部 电影 的 数据 集 规模 ， 这 
个 例子 是 小 巫 见 大 巫 。 同 时 ， 网 飞 的 数据 更 为 黎 玻 : 在 我 们 的 例子 里 ， 
表 中 有 839% 的 条 目 填 充 了 内 容 ， 而 网 飞 只 有 所 有 可 能 评级 中 的 不 到 196。 
不 过 ， 这 个 小 数据 集 足 以 说 明 主要 观点 。 


简单 预测 值 
如 何 建立 预测 式 ? 对 于 初学 者 ， 我 们 可 以 尝试 计算 训练 集中 所 有 条 


目的 平均 值 ， 并 应 用 于 所 有 未 知 的 条 目 。 对 于 训练 数据 中 的 20 个 数字 ， 
结 末 为 : 


中 对 中 入 生 帮 年 道生 名 生 汪 二 各 ovis 
20 加 


你 可 以 在 图 7-5 的 右 侧 看 到 这 一 结果 。 
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图 7-5 原始 评级 ( 左 ) 和 简单 预测 值 ( 右 ) 


让 我 们 通过 计算 均 方 误差 ， 以 评估 这 一 预测 值 的 质量 ， 我 们 可 以 将 
其 简称 为 “误差 ?。 如 前 所 述 ， 我 们 必须 采用 "“ 平 方差? 的 平均 值 。 我 们 将 
关注 该 测试 集 ， 但 可 以 在 训练 集 上 采用 相同 的 步骤 。 


首先 ， 对 于 测试 集中 的 每 个 元 素 ， 我 们 找 出 原始 评级 和 预测 评级 之 
间 的 差 值 ， 并 平方 。 以 用 户 B 和 电影 IV 为 例 : 预测 值 为 3.5， 原 始 评 级 是 
3， 因 此 平方 差 为 (3-3.5) ”= 0.25。 用 户 D 和 电影 I 如何 ?结果 是 (2- 
3.5) < =2.25; 


一 旦 我 们 得 出 图 7-5 测 试 集中 每 个 点 的 平方 莽 ， 束 能 算出 所 有 这 些 
值 的 平均 值 : 


(4— 3.5) + (2— 3.5) + (5— 3.5) + (3—3.5) + (4— 3.5) 
5 
~ 0.25 + 2.25 + 2.25 + 0.25 + 0.25 
5 


= 1.050 


对 于 训练 数据 ， 你 可 以 得 出 误 兰 为 1.350。 


基线 预测 值 


依赖 网 飞 数据 集 的 整体 平均 评级 会 相当 幼稚 。 这 就 像 在 第 6 章 ， 对 
亚马逊 上 的 所 有 产品 使 用 相同 的 平均 买 家 评论 一 样 。 也 许 我 们 可 以 把 那 
半 中 学 到 的 两 点 结合 : 一 些 评 论 者 往往 更 加 宽松 (苛刻 ) ， 同 时 有 的 项 
目 〈 在 这 种 情况 下 是 电影 ， 本 来 束 比 其 他 的 更 好 (更 产 )。 


例如 ， 看 看 用 户 D。 她 给 的 最 高 评级 是 3， 这 是 给 电影 〈II) 的 ， 
该 电影 得 到 其 他 用 户 的 评级 均 为 4 和 5。 她 还 给 了 两 个 2， 并 且 实 际 上 是 
唯一 给 评级 1 的 人 。 因 此 ， 用 户 D 似 乎 是 一 个 苛刻 的 评论 者 ， 她 给 电影 I 
的 预测 评级 应 该 能 反映 出 这 一 点 。 同 时 ， 看 看 电影 III: 除了 一 个 评级 
3〈 来 自 苛 刻 的 评论 者 D) ， 它 得 到 的 都 是 4 和 5。 我 们 预计 这 部 电影 更 
可 能 得 到 那些 尚未 评级 者 的 好 评 。 


换 句 话说 ， 每 个 用 户 和 每 部 电影 都 有 其 评级 偏差 。 基 线 预测 值 
(baseline predictor) 假设 ， 特 定 用 户 - 电 影 对 儿 的 评级 会 被 相应 偏 
差 从 整体 平均 值 中 抵消 ， 也 就 是 : 


评级 = 平均 值 + 用 户 偏差 + 电影 偏差 


我 们 已 经 知道 如 何 得 到 (整体 ) 平均 值 。 那 么 偏 项 呢 ? 我 们 可 以 通 
过 考虑 用 户 与 电影 的 相互 作用 《“ 即 某 个 用 户 如 何 给 电影 评级 ， 以 及 东部 
电影 如 何 被 用 户 评级 〉 来 计算 偏 项 。 在 一 般 情况 下 ， 要 找到 可 能 的 最 佳 
值 ， 我 们 需要 解决 一 个 优化 问题 。 比 起 这 样 做 ， 让 我 们 采取 一 个 直观 的 
方法 : 对 于 东 个 用 户 ， 找 到 其 对 所 有 评级 电影 〈 在 训练 数据 中 ) 的 平均 
评分 ， 并 与 整体 平均 值 比较 。 如 果 它 更 蜗 ， 这 表示 他 相 比 整个 数据 集 有 
多 么 宽容 如 果 更 低 ， 这 表示 他 有 多 么 苛刻 。 同 样 ， 对 于 每 一 部 电影 ， 
我 们 找 出 所 有 用 户 给 它 的 评级 ， 并 与 整体 平均 值 进行 比较 。 


回 到 图 7-4。 对 于 苛刻 的 用 户 D， 有 四 个 评级 的 训练 数据 : 2、3、1 
和 2。 因 此 ， 


偏差 D = 一 一 -35=-- LL 


这 明显 低 于 零 ， 正 如 我 们 所 预计 的 : 她 的 平均 评级 远 低 于 整体 平均 
值 。 好 电影 II 怎么 样 ? 也 有 四 个 评级 : 4、5、3 和 5。 因 此 ， 


二 十 S+3+ 
粮 差 IL = < — 3 _35=07 


正如 我 们 所 预计 的 ， 结 果 大 于 零 。 你 可 以 以 同样 的 方式 算出 其 余 偏 
项 。 数 值 在 图 7-6 中 ， 在 行 ( 用 户 〉》 和 列 ( 电 影 ， 的 末尾 。 


有 了 这 些 偏 项 ， 我 们 可 以 做 出 基线 预测 。 对 于 用 户 D 评 级 电影 III， 
我 们 将 得 到 什么 结果 ? 


平均 值 + 偏差 D + 偏差 IIT = 3.5 一 1.5 + 0.75 = 2.75 
| 


A 四 古本 古本 0.83 


0.30 -1.17 0.75 -0.50 0.10 
图 7-6 用 户 和 电影 偏 项 在 对 应 行列 ) 末尾 


这 距离 用 户 D 的 实际 评级 只 有 0.25。 选 取 我 们 没有 的 评级 ， 我 们 对 
用 户 A 和 电影 HI 会 得 到 什么 结果 ? 


平均 值 + 偏差 A + 偏差 II = 3.5 + 0.83 - 1.17 = 3.16 


你 可 以 对 30 个 用 户 -电影 对 儿 中 的 每 一 个 重复 这 个 过 程 。 图 7-7 右 侧 
显示 完整 的 基线 预测 。 你 会 注意 到 ， 没 有 一 个 预测 值 低 于 1， 也 没有 一 
个 高 于 5。 为 什么 ” 当 预 测 值 超出 这 个 范围 例如， 对 于 用 户 E， 电 影 
II， 预 测 值 为 3.5 + 0.83 + 0.75 = 5.08) ， 如 果 保 持原 样 ， 只 会 使 误差 更 
严重 ， 因 为 实际 评级 不 可 能 超过 5 或 低 于 1。 我 们 应 该 始终 将 预测 评级 限 
制 在 这 个 范围 内 。 
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图 7-7 基线 预测 值 显示 在 右 侧 


那么 ， 使 用 基线 预测 时 的 误差 是 多 少 ? 比较 图 7-7 中 测试 集 的 预测 
与 实际 评级 ， 我 们 得 出 : 


(4— 2.80) + (2— 1.00) + (5— 5.00) + (3— 3.50) + (4— 3.85)” 
5 


”1.44+ 1.00+ 0.00+ 0.25+ 0.023 
5 


= 0.543 


相 比 简单 预测 的 测试 集 误差 1.050， 我 们 提高 了 (1 - 0.543 / 1.050) 
x100% = 48%。 你 可 以 得 出 训练 数据 的 基线 预测 误差 为 0.223， 它 相 比 
1.350 提 高 了 83%。 不 错 啊 ! 


“ 邻 夺 ”的 帮助 


到 目前 为 止 ， 我 们 一 直 在 计算 评级 数据 各 行 或 各 列 的 平均 值 ， 以 找 
到 用 户 与 电影 的 相互 作用 。 如 果 利 用 不 同 电影 和 不 同 用 户 之 间 的 相似 
性 ， 结 果 会 怎样 ? 这 是 邻 式 模型 (neighborhood model) 的 精髓 ， 
如 果 两 个 用 户 关于 电影 有 特别 相似 (或 不 同 ) 的 意见 ， 或 者 两 部 电影 的 
用 户 评级 特别 相似 (或 不 同 ) ， 我 们 便 称 之 为 “邻居 ”。 邻 式 模型 是 协同 
过 滤 (collaborative filtering) 中 一 个 更 直观 的 方法 ， 我 们 通过 观察 
实体 如 何 “ 合 作 ”( 在 这 种 情况 下 ， 其 如 何 评级 或 被 评级 ) ， 将 数据 集 过 
滤 ， 寻 找 模式 。 接 下 来 我 们 转 回 这 个 方法 。 


相似 性 和 相 异 性 


假设 安娜 和 本 都 喜欢 电影 《心灵 捕手 》 和 《美丽 心灵 》 ， 同 时 都 不 
喜欢 《狮子 王 》 和 《阿拉 丁 》， 如 图 7-8 所 示 。 在 这 种 情况 下 ， 安 娜 和 
本 似乎 是 正 相关 (positively correlated) 用 户 ( 即 他 们 有 类 似 的 喜 
好 ) 。 所 以 ， 如 果 我 们 知道 安娜 喜欢 《 侏 罗 纪 公园 》， 我 们 预计 本 也 喜 
欢 它 ; 如 果 我 们 知道 安娜 不 喜欢 它 ， 我 们 预计 本 也 不 会 喜欢 它 。 相 关 性 
也 反 向 成 立 ， 如 果 本 不 喜欢 前 两 部 电影 ， 而 喜欢 后 两 部 ， 那 么 安娜 和 本 
似乎 高 度 负 相关 (negatively correlated) 。 在 这 种 情况 下 ， 如 果 安 
娜 喜欢 《 侏 罗 纪 公园 》， 我 们 预计 本 不 喜欢 它 ， 反 之 亦 然 。 


《心灵 捕手 让 (美丽 心灵 》|《 狮 子 王 》K 阿 拉丁 》 


相似 用 户 


图 7-8 
注 : 两 个 用 户 对 电影 倾向 于 有 相同 观点 时 ， 他 们 具有 相似 性 


再 举 一 个 例子 。 假 设 《 心 灵 捕 手 》 和 《美丽 心灵 》 都 获得 安娜 和 本 
的 高 评级 ， 并 且 都 获得 查理 的 低 评 级 。 那 么 ， 如 果 达 娜 给 《心灵 捕手 》 
高 评级 ， 我 们 预计 她 也 会 给 《美丽 心灵 》 高 评级 ， 因 为 别人 的 意见 表明 
这 两 部 电影 呈正 相关 《“ 即 有 相似 的 类 型 、 质 量 等 ) 。 同 样 ， 如 果 达 娜 给 
其 中 一 部 电影 低 评 级 ， 我 们 预计 她 也 会 给 男 一 部 低 评级 。 反 之 亦 然 ， 你 
可 以 在 图 7-9 中 看 到 : 如 果 安 娜 、 本 和 查理 给 《美丽 心 姑 》 与 给 《心灵 
捕手 》 的 评级 相反 ， 那 么 这 两 部 电影 呈 负 相关 ， 我 们 预计 达 娜 也 会 给 这 
两 部 电影 相反 的 评级 。 


不 同 的 电影 


《心灵 捕手 》|《 美 丽 心 灵 》 


图 7-9 两 部 电影 获得 用 户 反 馈 相 反 则 相 异 


我 们 如 何 量化 相似 性 的 概念 ?标准 度量 称 为 余弦 相似 度 (cosine 
similarity) 。 对 其 进行 计算 需要 一 点 儿 几 何 知识 ， 所 以 我 们 不 会 进行 
具体 的 数学 运算 。 如 果 你 对 其 中 的 细节 感 兴趣 ， 请 参考 本 书 网 站 Q7.3 部 
分 。 电 影 间 相似 度 的 计算 结果 在 图 7-10 中 给 出 。 例 如 ， 根 据 这 张 表 ， 我 
们 可 以 说 ， 电 影 II 和 IV 之 间 的 相似 度 为 0.50。 
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图 7-10 电影 与 电影 间 的 相似 度 表 
注 : 在 每 部 电影 的 列 中 ， 与 其 最 接近 的 电影 被 高 亮 显示 
我 们 如 何 解释 这 些 数值 ? 这 里 有 几 个 重要 的 余弦 相似 度 性 质 ， 将 给 
我 们 提供 帮助 : 


。 它 将 永远 处 于 -1 和 1 之 间 。 
完全 正 相 关 值 为 1。 一 个 接近 1 的 值 是 强 正 相 关 〈 即 有 很 高 的 
相似 度 ) 。 
完全 负 相 关 值 为 - 1。 一 个 接近 - 1 的 值 是 强 负 相关 〈 即 有 很 
高 的 相 异 度 ) 。 
完全 无 相关 值 为 0。 一 个 接近 0 的 值 表 示 只 有 弱 相 关 〈 即 既 不 
相似 ， 也 不 相 异 ) 。 


我 们 可 以 对 电影 II 和 V 进 行 何 种 推测 呢 ? 因为 0.79 接 近 1， 因 此 这 两 
部 电影 呈正 相关 。 从 图 7-4 的 评级 看 ， 这 是 有 道理 的 : 用 户 A 和 B 对 这 两 
部 电影 的 评级 都 比较 高 ， 用 户 D 对 这 两 部 电影 的 评级 都 比较 低 〈 我 们 无 
法 考虑 其 他 用 户 ， 因 为 他 们 没有 对 训练 集 里 的 两 部 电影 评级 ) 。 电 影 I 
和 II 怎 么 样 ? 因为 = 0.11 和 1 或 - 1 都 不 接近 ， 这 就 是 说 ， 它 们 既 不 正 相 
关 ， 也 不 负 相 关 。 


明 乔 地 选择 你 的 近邻 


这 些 电影 之 间 的 相似 度 值 ， 或 者 用 户 之 间 的 相似 度 ， 是 我 们 在 建立 
邻 式 模型 时 所 使 用 的 数值 。 那 么 我 们 如 何 从 “相似 ”发 展 到 “近邻 ”? 我 们 
可 以 使 用 各 种 规则 来 确定 东部 电影 的 近邻 。 例 如 ， 我 们 可 以 沿 着 各 列 ， 
选择 三 部 具有 最 高 相似 度 值 的 电影 。 或 者 ， 我 们 可 以 说 ， 如 果 任 何 电影 
有 辟 于 茶 个 效 值 的 相似 度 值 ， 那 么 它们 都 是 近邻 。 我 们 这 里 说 的 “更 
高 ? 指 的 是 绝对 值 较 遍 : 可 以 是 强 正 相关 或 强 负 相关 。 这 两 种 类 型 都 是 
有 用 的 。 


为 了 简化 后 面 的 数学 计算 ， 让 我 们 为 每 部 电影 选择 最 佳 的 单个 邻 
居 。 你 可 以 在 图 7-10 中 看 到 结果 : 一 个 高 亮 的 框 表示 列 中 的 电影 将 选择 
行 中 的 电影 作为 其 近邻 。 例 如 ，V 选 择 II 作为 其 近邻 。 这 是 否 意味 着 I 将 
选择 V? 不 是 ， 尽 管 相似 度 值 是 对 称 (symmetric) 的 〈 即 I 对 V 的 相 
似 度 和 V 对 I 的 相似 度 相 同 ) ， 近 邻 选择 则 不 必 如 此 。II 与 IV 的 相关 上 度 大 
于 和 V 的 相关 度 ， 所 以 I 选择 IV 作 为 其 近邻 。 


我 们 也 可 以 将 近邻 选择 体现 为 一 张 图 。 你 可 以 在 图 7-11 中 看 到 : 每 
部 电影 都 是 一 个 节点 ， 指 辣 它 选择 的 近邻 。 如 果 我 们 允许 电影 选择 更 多 
的 近 令 ， 图 中 每 个 节 反 将 有 更 多 的 传 出 链接 。 


N 


图 7-11 最 近邻 电影 关系 图 
注 : 来 自 节点 的 连接 表示 其 最 近邻 。“N” 表 示 负 相关 ，“P” 表 示 正 相关 


现在 ， 这 些 近邻 怎么 办 ? 我 们 使 用 它们 的 方式 希望 能 提高 我 们 的 预 
测 质 量 。 要 做 到 这 一 点 ， 我 们 对 从 图 7-7 中 的 基线 预测 获得 的 误差 加 以 
利用 ,希望 用 这 种 方法 校准 误差 ， 否 则 其 可 能 从 训练 集 传导 至 测试 集 。 
通过 从 原始 评级 中 减 去 基线 预测 值 ， 我 们 得 到 每 个 用 户 - 电 影 对 儿 的 误 
差 ， 如 图 7-12 所 示 。 这 些 都 是 成 对 误差 ( 即 每 个 用 户 - 电 影 对 儿 只 有 一 
个 误差 ， 而 不 是 均 方 误差 那 种 用 来 衡量 整体 质量 的 单一 总 结 性 误差 。 


| | 册 IV V 
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图 7-12 基线 预测 误差 表 
现在 我 们 有 了 应 用 近邻 法 需要 的 所 有 条 件 。 让 我 们 先 以 电影 V 和 用 


户 C 为 例 。 电 影 V 的 最 近邻 是 I， 上 有 具 有 很 高 的 正 相 关 性 〈0.88) 。 用 户 C 
对 电影 I 评级， 其 预测 误差 为 0.67。 这 个 误差 说 明 什 么 ?我 们 的 预测 偏 
低 0.67， 同 时 因为 电影 V 与 I 相似， 我 们 对 用 户 C 给 电影 V 评 级 的 预测 可 
能 也 偏 低 。 所 以 我 们 给 2.60 的 基线 预测 加 上 0.67: 

2.60 + 0.67 = 3.27 


与 实际 评级 3 相 比 ， 这 里 的 误差 较 小 : 偏 高 了 0.27， 而 不 是 偏 低 
0.40。 


让 我 们 再 举 一 个 例子 : 用户 B 对 电影 IV 的 评级 。 电 影 IV 的 最 近邻 是 
II， 两 者 为 完全 负 相 关 〈-1.00) 。 用 户 B 对 电影 开 评 级 的 预测 误差 为 
0.17， 表 示 预 测 偏 低 0.17。 由 于 IV 和 II 相 异 ， 因 此 我 们 对 用 户 B 给 电影 TV 
的 评级 预测 可 能 过 高 。 那 么 在 这 种 情况 下 该 怎么 办 ? 我 们 从 基线 预测 
3.50 中 减 去 0.17: 


3.50 — 0.17 = 3.33 
同样 ， 这 里 的 误差 较 小 〈0.33 比 0.5 小 ) 。 


所 以 ， 如 果 相 关 性 为 正 ， 那 么 我 们 加 上 近邻 的 基线 误 莹 ， 如 果 相 关 
性 为 负 ， 那 么 我 们 减 去 误差 : 


评级 = 基线 预测 + 近邻 误差 
这 是 一 个 邻 域 预 测 (neighborhood predictor) 的 简单 形式 ， 在 


这 里 我 们 只 使 用 最 近邻 。 如 前 所 述 ， 这 种 方法 可 以 扩展 到 使 用 更 多 的 近 
邻 ， 但 我 们 不 会 进行 讨论 。 


我 们 可 以 将 邻 域 预测 情况 作为 第 一 部 分 提 到 的 一 种 负 反 馈 。 它 利用 
基线 误差 作为 一 种 “反馈 信 写 ”， 对 输出 中 的 潜在 “错误 ”进行 修正 ， 残 像 
功率 控制 根据 目标 信号 质量 差异 进行 调整 那样 。 


完整 预测 显示 在 图 7-13 石 侧 ， 其 中 一 些 值 与 图 7-7 中 所 示 的 基线 预 
测 值 相同 。 这 是 怎么 友 生 的 ? 当 用 户 没 有 对 近邻 电影 进行 评级 ， 或 者 近 
邻 评级 不 是 训练 数据 的 一 部 分 时 。 例 如 ， 以 用 户 C 对 电影 的 评级 为 例 。 
电影 I 的 近邻 是 II， 而 C 没 有 对 其 评级 。 所 以 我 们 没有 改变 基线 预测 。 


:号 , 罗 克 


区 加 加 区 加 
四 四 回回 可 

我 们 不 能 期 望 每 个 评级 的 误差 都 会 降低 。 以 用 户 F 对 电影 V 的 评级 
为 例 : 近邻 法 预测 评级 为 3.27， 相 比 3.85 的 基线 预测 ， 其 距离 实际 评级 4 


LL I ll IV YV 
四 吕 罗 开罗 
四 图 四 区 加 
四 区 区 四 四 
加 四 加 加 加 
图 7-13 邻 域 预测 显示 在 右 侧 
更 远 ! 但 即使 在 个 别 情况 下 ， 邻 域 预 测 可 能 会 偏离 ， 我 们 预计 它 整 体 上 
仍然 利 大 于 浆 。 要 对 此 进行 检验 ， 让 我 们 找 出 整体 误差 。 对 于 测试 集 ， 
我 们 得 出 : 


(4— 2.80) + (2— 1.50) + (5— 5.00) + (3— 3.33) + (4— 3.27)° 


3 
_ 1.44+ 0.25+ 0.00+ 0.11+ 0.53 
5 


= 0.466 


同样 ， 我 们 可 以 评估 训练 数据 的 误差 为 0.134， 相 比 原来 的 简单 平 
均 预测 ， 对 测试 集 的 预测 提高 了 56%， 对 训练 集 的 预测 提高 了 90%。 与 
基线 预测 相 比 ， 两 者 分 别提 高 了 14% 和 39%。 


作为 总 结 ， 在 图 7 一 14 的 例子 中 ， 你 可 以 看 到 从 训练 数据 和 测试 数据 
中 获得 的 各 种 预测 误 兰 的 比较 。 前 三 组 条 形 是 我 们 在 本 章 讨 论 方法 的 结 
条 。 第 四 组 显示 ， 如 果 我 们 对 每 部 电影 使 用 两 个 最 近邻 ， 而 不 只 是 一 个 
最 近邻 ， 将 产生 什么 误 状 。 事 实证 明 ， 训 练 集 的 误 兰 保持 大 致 相同 ， 而 
在 测试 数据 上 则 显 着 上 升 ， 所 以 在 这 种 情况 下 ， 一 个 近邻 实际 上 是 更 好 


的 选择 。 


1.50 
1.350 


训练 数据 国 测试 数据 


图 7-14 在 不 同 预测 的 例子 中 使 用 训练 和 测试 数据 产生 的 误差 


我 们 以 前 次 过 ， 基 于 列 《 行 ) 的 平均 值 计算 基线 预测 的 偶 兰 值 不 是 
最 佳 方法 。 第 五 组 条 形 显 示 ， 如 采 我 们 解决 了 偶 项 的 优化 问题 ， 将 产生 
什么 误差 : 它 降低 了 第 二 列 中 的 误差 。 最 后 显示 了 ， 如 果 我 们 使 用 优化 
基线 的 近邻 法 ， 将 产生 什么 误差 。 事 实 上 ， 事 后 看 来 ， 使 用 两 个 近邻 将 
是 更 好 的 选择 在 图 7-14 的 所 有 方法 中 ， 这 将 是 给 本 示例 市 来 的 最 大 改 
进 。 


我 们 在 本 半 中 的 目的 ， 不 是 解释 网 飞 奖 比赛 获胜 算法 的 所 有 细 市 。 
这 需要 很 多 高 级 的 数学 技巧 。 但 是 你 现在 知道 网 飞 进行 电影 推荐 背后 的 
基本 思路 : 寻找 用 户 之 间 和 电影 之 间 的 模式 ， 并 利用 这 些 模式 来 预测 未 


知 意见 。 


第 8 章 
21 作 写 < 
我 们 刚刚 看 到 ， 如 何 根 据 从 “群众 ”中 收集 的 信息 做 出 决定 。 在 本 章 


中 ， 我 们 将 讨论 人 们 互相 学 习 的 情况 ， 每 个 人 都 将 自己 的 智慧 带 到 人 和 群 
中 。 


技术 与 教学 : 扩展 学 习 


创造 互联 网 背后 的 动机 之 一 是 ， 使 获取 内 容 变 得 更 容易 。 今 天 ， 我 
们 除了 一 次 次 地 浏 贤 特 定 的 信息 块 ， 还 可 以 参加 围绕 尔 个 学 科 内 容 组 织 
的 整个 读 程 。 相 比 于 去 真正 的 课 符 参 加 讲座 ， 互 联网 使 我 们 有 了 在 电脑 
上 观看 讲座 视频 的 可 能 。 


正如 人 们 所 言 ， 在 线 学 习 已 经 流行 起 来 了 。 许 多 高 等 教育 机 构 现在 
提供 在 线 全 学 位 课程 ， 大 多 数 高 校 至 少 为 学 生 提 供 部 分 在 线 课 程 。 事 实 
上 ， 在 2012 年 秋季 ， 超 过 25% 的 大 学 生 在 网 上 至 少 学 习 了 一 门 课程 。 


在 过 去 10 年 中 ， 因 特 网 在 两 种 意义 上 扩展 了 学 习 。 学 习 网 上 谍 程 的 
忆 人 数 已 经 大 大 增加 ， 在 同一 时 间 学 习 同 一 课程 的 人 数 也 大 大 增加 。 在 
某 些 情况 下 ， 后 者 人 数 已 达到 数 10 万 ! 当 一 个 班 的 学 生 人 数 变 得 非常 庞 
大 时 ， 对 于 老师 来 说 ， 要 回答 所 有 问题 并 满足 学 生 的 所 有 需要 就 变 得 很 
有 挑战 性 了 。 学 生 需 要 社交 性 学 习 ， 也 就 是 相互 学 习 和 指导 。 


远程 学 习 


说 远程 学 习 (distance learning) 始 于 互联 网 就 像 是 说 交通 始 于 
汽车 一 样 。 多 年 来 ， 大 多 数 通信 系统 被 用 来 以 各 种 方式 促进 教育 。 一 些 
学 位 课程 通过 邮寄 方式 进行 ， 将 学 习 材 料 和 作业 寄 到 人 们 家 里 ， 这 早 在 
19 世 纪 中 叶 就 已 经 出 现 。20 世 纪 早 期 和 中 期 ， 当 广播 电视 变 得 流行 ， 一 
些 大 学 也 开始 通过 这 些 类 型 的 网 络 广播 课 程 讲座 。 


随 着 网 络 的 兴起 ， 在 线 课程 、 在 线 学 位 甚至 在 线 大 学 在 20 世 纪 90 年 
代 开 始 莲 勃发 展 。 到 2003 年 ，80% 的 大 学 至 少 有 一 门 课程 在 某 种 程度 上 
使 用 了 在 线 技术 。 到 2014 年 ， 只 有 不 到 5% 的 公立 高 校 没 有 提供 任何 形 
式 的 在 线 课 程 。 


在 线 学 习 提 供 了 哪些 以 前 远程 学 习 没 有 提供 的 东西 ? 对 各 种 技术 文 
持 的 教学 模式 进行 比较 是 很 有 帮助 的 。 一 个 基本 场景 如 图 8-1 所 示 。 呆 
教师 讲课 听觉， 看 到 正在 书写 的 信息 (视觉 )， 阅 读 材 料 〈 文 
本 ) ， 与 同学 讨论 (社交 ) 并 实时 (同步 ) 提出 问题 。 正 如 我 们 在 学 校 
所 经 历 的 ， 面 对 面 的 读 符 形式 文 持 所 有 这 些 模式 。 除 了 同步 学 习 ， 互 联 
网 可 以 实现 以 上 所 有 功能 ， 它 可 以 提供 预先 录制 好 的 讲座 视频 听觉 和 
视觉 ) ， 学 生 讨论 论坛 〈 社 区 ) ， 以 及 补充 材料 (通常 为 文本 ) 。 其 他 
每 项 技术 只 能 文 持 一 种 或 两 种 模式 。 


图 8-1 
注 : 按 其 便于 支持 的 学 习 模式 ， 比 较 教 学 中 所 应 用 的 技术 


不 同类 型 的 在 线 学 习 也 已 经 出 现 。 有 些 课 程 开 放 给 任何 人 报名 ， 而 
其 他 课程 被 作为 学 位 课程 的 一 部 分 。 一 些 课 程 大 量 招生 ， 而 另 一 些 则 按 
照 传 统 课 符 规 模 招 生 。 


最 新 的 在 线 学 习 类 型 可 以 追溯 到 2002 年 ， 当 时 麻 省 理工 学 院 创 建 了 
一 个 免费 提供 本 校 课程 材料 的 网 上 资源 库 ， 任 何人 都 可 以 访问 。 许 多 人 
对 这 种 大 胆 而 似乎 不 必要 的 举动 感到 困惑 。 为 什么 搁 省 理工 学 院 决 定 将 
课程 材料 免费 在 线 提供 ? 麻 省 理工 学 院 如 此 广泛 地 传播 知识 ， 会 得 到 什 
么 回报 ?事实 证 明 ， 这 是 一 次 有 局 发 性 的 探索 行为 ， 最 终 成 为 一 股 潮 
流 ， 它 将 普通 课堂 大 小 的 在 线 课 程 转变 为 供 诬 。 最 近 10 年 ， 美 国 许多 顶 
尖 大 学 加 入 了 这 一 行动 ， 其 中 一 半 仍 随 膝 省 理工 的 倡议 ， 与 Coursera、 
edX、Udacity、Udemy 等 妈 课 网 站 合作 ， 提 供 自己 的 课程 。 实 际 上 ， 本 
书 的 前 映 就 是 2012 年 的 第 一 门 关 于 网 络 的 芭 课 课程 。 


莫 课 (MOOC ) 中 的 “MOO” 


现在 有 十 几 个 获 读 提供 丙 ， 每 个 在 操作 上 都 有 一 定 兰 别 ， 但 其 中 大 
多 数 有 一 些 共 同属 性 。 和 凭借 “ 茶 谍 提供 丙 * 的 名 称 ， 它 们 的 谍 程 在 网 上 所 
供 ， 并 疝 任何 人 升级 ， 要 么 免费 ， 要 么 颖 用 低廉 。 教 师 教授 桶 诬 最 流行 
的 方式 ， 是 通过 YouTube 式 的 讲座 视频 ， 在 其 中 区 入 检测 问题 ， 如 图 8- 
2 所 示 。 这 些 平台 还 通过 讨论 i 
互相 提问 和 回答 问题 。 


Clustering coefficient 
» Back to example 
Number of triangle 


讲座 视频 视频 内 测试 
图 8-2 


注 : 讲座 视频 〈 左 ) 和 诅 入 视频 问答 测试 ( 右 ) 示例 ， 来 自 基 于 本 书 的 一 门 网 络 课 
程 〈 你 会 在 第 14 章 看 到 该 材料 ) 


作为 开放 式 在 线 传输 的 副产品 ， 荫 这 吸 引 了 大 量 学 习 者 。“ 大 量 ” 到 
底 是 多 少 ? 一 个 标准 的 形 课 课程 有 上 万 到 数 十 万 名 来 自 世 界 各 地 的 学 习 
者 。 想 象 和 这 么 多 人 面对面 在 真正 的 谍 符 里 吧 ! 虽然 这 在 生活 中 似乎 不 
太 可 能 ， 但 网 络 技术 的 进步 使 许多 人 有 可 能 一 起 在 虚拟 的 在 线 读 瘟 中 学 
3 


即使 在 只 有 几 十 名 学 生 的 传统 课堂 里 ， 任 何 教 师 都 会 尽力 解决 每 个 
人 的 所 有 问题 、 关 切 和 误解 。 作 为 教师 ， 重 要 的 工作 是 个 性 化 学 习 
(individualizing learning) 〈 即 进行 一 些 调整 ， 以 将 材料 教 给 每 一 
个 学 生 ) 。 在 莫 课 中 实现 这 一 目标 很 复杂 。 庞 大 的 规模 使 每 个 教师 要 对 
更 多 学 生 负 责 。 开 放学 习 往 往 会 吸引 不 同 背 景 的 学 生 ， 他 们 的 背景 知识 
re ke 这 要 求教 师 在 一 开始 就 进行 更 厂 泛 的 区 

。 上 此外， 如果 师 生 只 是 在 线 互 动 ， 教 师 将 更 难 了 解 每 个 学 生 的 学 习 需 
求 


长 话 短 说 (获得 更 多 信息 ， 请 参考 本 书 网 站 Q8.1~Q8.6 部 分 )， 将 
传统 教学 方法 扩展 到 莫 课 的 规模 是 具有 挑战 性 的 。“ 一 刀 切 
式 ” (one-size-fits-all) 的 教学 风格 适用 于 所 有 人 ， 但 即使 基于 课程 
的 “平均 ”学 习 需 求 进行 战略 设计 ， 它 仍然 不 太 可 能 在 许多 学 生 身 上 取得 
良好 效果 (图 8-3) 。 ae 个 组 成 部 分 是 可 扩展 的 : 社 
会 网 络 中 发 生 的 学 习 。 这 一 点 我 们 接 下 来 将 看 到 。 


课堂 MOOC 


U 
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学 习 需 求 


图 8-3 
注 : 如 果 教 师 必须 选择 一 种 方法 来 教 每 个 人 ， 他 最 好 的 办 法 是 基于 每 种 情况 下 的 学 
习 需 求 “ 中 点 ”进行 教学 。 在 课堂 里 ， 这 仍然 可 以 接近 大 多 数学 生 的 水 平 ， 但 在 幕 
课 中 ， 很 多 学 生 水 平 都 相差 甚 远 


社会 化 学 习 


如 宁 鲍 艺 对 所 学 读 程 中 的 部 分 材料 感到 困惑 ， 他 能 做 什么 ? 如 果 他 
在 一 大 群 同伴 中 ， 教 师 不 太 可 能 满足 鲍 动 与 其 他 人 的 所 有 其 体 学 习 需 
要 。 好 处 是 ， 可 能 至 少 有 一 个 同伴 能 帮助 他 ， 而 且 也 会 有 许多 人 从 他 的 


问题 得 到 解答 中 受益 。 


我 们 在 这 里 描述 的 是 社会 化 学 习 (social learning) 的 过 程 ， 学 
生 通 过 互动 和 协作 来 学 习 。 他 们 可 以 合作 ， 讨 论 他 们 学 到 了 什么 ， 并 回 
答对 方 的 问题 。 社 会 化 学 习 是 慕 课 的 重要 组 成 部 分 ， 也 是 整个 教育 的 重 
要 组 成 部 分 。 群 众 智慧 不 是 从 一 个 人 的 知识 中 获得 ， 而 是 从 许多 人 的 集 
体 知识 中 获得 。 


论坛 讨论 


网 上 课程 社会 化 学 习 的 工具 是 什么 ? 学 生 间 《以 及 师 生 ) 互动 的 主 
要 手段 是 讨论 论坛 (discussion forum) 。 你 可 以 在 图 8-4 中 看 到 一 张 
论坛 快照 : 人 们 通过 消息 序列 交流 ， 其 中 每 条 “消息 ?是 一 张 帖子 或 对 其 
的 评论 。 消 息 由 学 生 写 的 文本 组 成 。 一 系列 帖子 〈 及 其 评论 ) 将 包含 在 
一 个 更 大 的 线程 (thread) 中 ， 整 个 论坛 束 是 这 样 的 线程 集合 。 


Thread 
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注 : 一 个 慕 课 的 讨论 论坛 通常 被 分 解 成 一 系列 线程 〈 左 ) 。 在 每 个 线程 中 是 一 系列 
帖子 ， 每 个 帖子 可 能 有 评论 回应 ( 右 ) 

学 生 如 何 使 用 论坛 ? 让 我 们 回 到 鲍 勃 的 问题 。 他 可 以 先 检查 ， 看 是 
否 有 人 已 经 在 论坛 上 发 帖 问 同样 的 问题 ， 或 者 一 个 很 类 似 的 问题 ， 或 者 
问题 的 答案 也 可 以 。 他 可 以 通过 输入 问题 的 类 似 语句 进入 搜索 栏 ， 或 通 
过 手动 浏览 论坛 来 寻找 相似 问题 。 


如 果 鲍 动 确实 找到 了 一 个 已 经 在 问 他 的 问题 的 帖子 呢 ? 那 他 可 以 看 
到 评论 或 其 他 帖子 中 是 否 有 答案 。 如 果 有 答案 的 话 ， 假 如 答案 好 ， 那 么 
他 可 以 赞成 该 答案 ， 假 如 答案 不 好 ， 那 么 他 可 以 反对 该 答案 ， 以 此 给 予 
反馈 。 如 果 还 没有 回答 ， 那 么 他 可 以 赞成 这 个 问题 ， 以 便 其 他 人 注意 
到 ， 并 尽快 回答 。 


如 宁 他 找 不 到 这 样 的 帖子 怎么 办 ? 那 他 可 以 看 看 是 否 有 类 似 线程 的 
讨论 ， 并 发 布 一 个 新 的 帖子 。 如 宁 他 没有 发 现任 何 接近 他 想 要 的 线程 ， 
他 可 以 创建 一 个 有 适当 标题 的 全 新 线程 。 你 可 以 在 本 书 网 站 Q8.7 部 分 找 
到 这 一 过 程 的 流程 图 。 


社会 化 学 习 网 络 


基于 同伴 的 学 习 创 造 了 一 个 社会 化 学 习 网 络 (Social Learning 
Network) ， 简 称 SLN。 社 会 化 学 习 网 络 的 三 个 主要 特征 都 包含 在 它 
的 名 字 中 : 


。 学 习 是 发 生 的 过 程 ， 代 表 对 有 关 话 题 的 知识 获取 。 通 常情 况 
下 ， 它 可 以 分 解 成 一 组 构成 学 习 材 料 的 主题 。 

。 社会 化 学 习 依 赖 同伴 间 的 互动 。 可 能 有 指定 的 教师 ， 但 如 果 
没有 个 别 学 习 者 之 间 的 合作 ， 网 络 将 不 会 有 效 。 

。 同伴 间 的 社会 化 网 络 取决 于 学 习 过 程 ， 进 而 又 影响 学 习 过 


程 。 


社会 化 学 习 网 络 对 如 何 实现 个 性 化 这 个 问题 给 出 了 有 趣 的 阐述 。 相 
比 依靠 教师 对 出 现 的 个 别 需求 做 出 回应 ， 我 们 可 以 在 社会 化 学 习 网 络 内 
部 搜索 解决 方案 。 学 习 过 程 变 得 可 扩展 ， 因 为 更 多 的 学 生 应 该 会 带 来 更 
多 的 问题 和 更 多 的 淤 在 问题 解答 者 ， 这 就 保持 了 两 者 之 间 的 平衡 。 你 可 
以 在 图 8-5 中 看 到 这 个 想法 。 


中 和 


大 
[2 


图 8-5 


注 : 当 教 师 ( 中 心 节点 ) 需要 应 对 课程 中 的 所 有 需求 时 〈 左 ) ， 学 习 过 程 是 不 可 扩 
展 的 。 社 会 化 学 习 网 络 的 前 提 是 ， 学 习 者 自己 也 可 以 成 为 教师 〈 右 ) 


类 似 于 网 飞 获取 用 户 电影 评级 和 亚马逊 收集 顾客 对 产品 评论 的 方 
法 ， 获 课 平 台 可 以 在 学 生 学习 课 程 时 记录 数据 。 这 些 数据 包括 他 们 之 间 
如 何 互 动 〈 例 如 通过 讨论 论坛 中 发 布 的 帖子 、 评 论 和 投票 ) ， 以 及 他 们 
如 何 消 化 课程 内 容 《〈 例 如 通过 他 们 在 观看 讲座 视频 时 点 击 的 顺序 ) 。 最 
终 ， 问 题 束 变 成 如 何 分 析 和 利用 这 些 数 据 。 


社会 化 学 习 网 络 在 哪里 ? 


到 目前 为 止 ， 我们 已 经 讨论 了 在 线 教育 背景 下 的 社会 化 学 习 网 络 和 
聚 课 。 我 们 还 能 在 哪里 找到 这 些 网 络 ?” 社会 化 学 习 网 络 存在 于 任何 社会 
化 学 习 发 生 的 情况 中 。 以 翻转 课堂 (flipped classroom) 为 例 ， 观 看 
通常 在 课堂 上 讲授 的 讲座 成 为 作业 的 一 部 分 ， 而 上 课时 间 则 用 来 讨论 和 
互动 。 当 教育 技术 和 这 些 课程 结合 起 来 部 蜀 ， 束 可 以 收集 关于 社会 化 学 
习 网 络 的 数据 。 


相关 应 用 也 存在 于 教育 之 外 。 除 了 教室 里 的 学 生 ， 还 可 以 考虑 公司 
雇员 的 情况 。 当 员工 刚 被 雇用 时 ， 他 们 通常 要 经 历 一 个 入 职 过 程 ， 学 习 
完成 工作 所 需 的 额外 材料 和 技能 。 在 职业 生涯 中 ， 他 们 还 经 常 参 加 企业 
培训 课程 。 为 了 促进 这 类 培训 和 其 他 情况 下 的 社会 化 学 习 ， 公 司 通常 建 
立 企业 社会 网 络 (enterprise ”social ”network) 平台 ， 如 Jive 和 


Yammer。 


最 后 ， 考 虑 问答 网 站 [Question and Answer (Q&A) sites] 的 
情况 ， 如 Quora、 雅 虎 Answers 和 Stack ”Overflow。 问 答 网 站 在 功能 上 类 
似 于 在 线 课 程 的 论坛 ， 它 在 提问 和 回答 者 中 创建 社会 化 学 习 网 络 。 它 们 
也 实施 激励 措施 ， 鼓 励 建设 性 的 参与 ， 用 户 收 到 提问 或 回答 点 赞 时 可 获 


得 积分 。 


在 本 章 的 其 余部 分 ， 我 们 将 概述 这 些 网 络 的 重要 研究 领域 。 这 是 撰 
写本 书 时 的 一 个 最 新 主题 ， 你 会 看 到 许多 有 趣 而 尚未 解答 的 问题 ， 它 们 


将 激励 后 续 研 究 。 同 样 重要 的 是 ， 你 会 看 到 将 不 同 关系 可 视 化 的 构建 网 
络 的 例子 。 


将 社会 化 学 习 网 络 有 效 可 视 化 


想象 一 个 论坛 中 的 一 系列 讨论 ， 如 图 8-4 所 示 。 关 于 社会 化 学 习 网 
络 ， 我 们 可 以 获得 很 多 信息 。 谁 发 布 了 一 个 线程 ? 谁 做 出 回复 ? 帖子 和 
回复 的 内 容 是 什么 ? 凡 此 种 种 ， 不 一 而 足 。 我 们 如 何 根据 这 些 信息 将 网 
络 可 视 化 ? 我 们 不 能 把 所 有 数据 放 在 一 张 图 中 ， 因 为 那样 会 太 过 混乱 和 
复杂 ， 无 法 从 中 得 出 有 意义 的 见解 。 我 们 必须 仔细 思考 ， 描 述 哪些 信息 
对 我 们 来 说 很 重要 。 


我 们 如 何 表示 网 络 ? 用 图 〈 如 第 5 章 的 网 络 图 ) 。 在 社会 化 学 习 网 
络 的 图 中 ， 我 们 应 该 把 什么 作为 节点 ? 链接 应 该 代表 什么 ”它们 应 该 是 
有 向 《从 一 个 节点 到 男 一 个 节点 ) 还 是 无 向 的 ? 它们 应 该 是 加 权 “《 用 数 
字 给 每 个 链接 权重 ) 还 是 不 加 权 的 ? 


也 许 首先 应 该 问 一 个 更 基本 的 问题 。 相 比 我 们 目前 为 止 看 到 的 其 他 
类 型 网 络 〈 如 第 5 章 的 网 页 网 络 或 第 1 章 和 第 2 章 的 设备 网 络 ) ， 社 会 化 
学 习 网 络 有 什么 不 同 ? 一 方面 ， 社 会 化 学 习 网 络 是 一 种 人 与 人 之 间 的 社 
会 化 网 络 ， 而 不 是 联网 设备 之 间 的 通信 网 络 ， 如 图 8-6 所 示 。 在 社会 化 
学 习 网 络 中 ， 人 们 之 间 的 通信 媒介 可 能 仍然 是 互联 网 ， 但 在 这 种 情况 
下 ， 我 们 更 关心 什么 信息 被 共 至 了 以 及 最 终 会 形成 什么 社会 关系 ， 而 不 
是 信息 如 何在 人 和 人 之 间 传 输 的 。 我 们 将 在 第 10 章 和 第 14 间 讨论 其 他 类 
型 的 社交 网 络 。 


社会 化 网 络 


通信 网 络 


图 8-6 
注 : 对 于 社会 化 网 络 ， 我 们 感 兴趣 的 是 人 与 人 之 间 的 互动 ， 而 在 研究 技术 网 络 时 ， 
我 们 专注 于 人 们 手中 的 设备 之 间 的 通信 和 渠道 
因此 ， 讨 论 的 图 应 描绘 信息 共 训 的 过 程 。 尽 管 如 此 ， 我 们 仍然 可 以 
选择 作为 节点 和 链接 的 许多 变化 形式 ， 这 取决 于 我 们 在 可 视 化 中 的 最 终 
目标 。 


学 生 图 


对 于 市 把 最 明显 的 选择 ， 是 用 它们 来 表示 不 同 的 学 生 。 那 么 ， 两 个 
学 生 《〈 如 爱丽 丝 和 鲍 艺 ) 之 间 的 连接 表示 什么 ? 它 应 该 代表 他 们 之 间 如 
何 分 享 信息 的 茶 种 关系 。 四 种 可 能 性 是 : 


(a) 爱丽 丝 和 钨 过 是 否 一 起 参加 了 讨论 。 

(b) 爱丽 丝 和 弧 多 少 次 一 起 参加 了 讨论 。 
(c) 爱丽 丝 是 否 回复 了 鲍 勃 的 帖子 ， 反 之 亦 然 。 
(d) 爱丽 丝 曾 回复 绝 勃 的 帖子 ， 反 之 亦 然 。 


这 些 表述 之 间 的 差异 可 能 很 小 ， 但 它们 各 自 会 产生 不 同类 型 的 链 


接 。 在 每 一 种 情况 下 ， 这 些 链 接 是 有 癌 还 是 无 同 ， 加 权 还 是 不 加 权 ? 你 
可 以 在 图 8-7 中 看 到 这 些 不 同 的 类 型 。 


(a) (b) 
无 向 无 加 权 无 向 加 权 
3 
(c) 有 癌 无 加 权 (d) 有 向 加 权 
O—® © 
Be 
图 8-7 


注 : 链 路 性 能 的 四 种 不 同 排列 组 合 方式 ， 可 用 于 将 社会 化 学 习 表 现 为 图 的 形式 


在 (a) 中 ， 我 们 得 到 一 个 无 回 的 无 加 权 图 : 如 果 我 们 发 现 了 一 个 
爱丽 丝 和 鲍 勃 都 发 布 的 线程 ， 那 么 他 们 之 间 有 链接 。 在 (b) 中 ， 我 们 
使 用 一 个 共同 参与 (co-participation) 计数 来 增加 (a) 的 权重 ， 得 
到 一 个 无 向 加 权 图 : 例如 ， 如 果 我 们 发 现 爱 丽 丝 和 鲍 勃 都 在 三 个 线程 中 
发 布 ， 那 么 他 们 之 间 的 链接 权重 是 3。 


(c) 与 (a) 不 同 ， 因 为 我 们 谈论 的 是 回复 。 如 果 鲍 勃 回 答 了 爱丽 
丝 发 布 的 一 个 问题 ， 那 并 不 代表 爱丽 丝 回答 了 鲍 勃 发 布 的 一 个 问题 。 我 
们 需要 用 第 头 来 表示 这 个 区 别 ， 所 以 我 们 得 到 一 个 有 问 无 加 权 图 。 在 
(d) 中 ， 我 们 相 比 (c) 更 进一步 ， 开 始 计算 回复 的 数量 ， 这 给 了 我 们 
一 个 有 问 加 权 图 : 如 果 鲍 动 回 复 了 爱丽 丝 4 次 ， 而 爱丽 丝 回 复 了 鲍 壹 1 
次 ， 那 么 饱 勃 对 爱丽 丝 的 链接 权重 为 4， 而 爱丽 丝 对 鲍 勃 的 链接 权重 为 
1。 


让 我 们 用 一 个 例子 ， 以 这 些 类 型 的 图 形 表 示 图 8-8 中 的 《小 型 ) 讨 
论 论坛 。 有 4 个 学 生 ， 爱 丽 丝 、 鲍 用 、 碍 理 和 达 娜 ， 都 在 不 同 程度 上 参 
与 论坛 。 四 个 线程 中 的 每 一 个 都 已 经 发 布 了 不 同 数量 的 帖子 ， 线 程 I 有 
两 个 ， 线 程 I 有 两 个 ， 等 等 。 每 个 帖子 中 都 有 一 个 人 提问 (上方 列 出 的 


名 字 ) ， 并 有 一 个 人 回答 〈 下 方 的 名 字 ) 。《【 现 实 中 ， 对 于 一 个 问题 ， 


可 能 会 有 很 多 回复 ， 而 一 个 帖子 中 可 能 根本 就 没有 提出 问题 。) 
讨论 论坛 


线程 I 线程 I 线程 TI 线程 IV 


| ..--- 提 问 者 
= 回答 者 


图 8-8 包含 4 个 线程 、4 个 学 生 和 8 个 节点 的 小 型 讨论 论坛 


对 于 每 个 图 形 类 型 ， 我 们 将 以 什么 作为 节点 ?我 们 将 有 4 个 市 反 ， 
每 个 学 生 就 是 一 个 。 那 么 链接 呢 ? 让 我 们 分 别 分 析 每 种 情况 ， 对 于 鲍 动 
和 查理 而 言 : 


(a) 无 向 ， 无 加 权 : 忽 过 和 查理 一 起 加 入 了 线程 吗 ? 是 的 ， 他 
们 都 加 入 了 线程 1 和 1V， 所 以 我 们 在 图 中 画 出 他 们 之 间 的 链接 。 

(b) 无 向 ， 加 权 : 钨 过 和 查理 共同 加 入 了 多 少 线 程 ? 两 个 。 所 
以 他 们 的 链接 权重 是 2。 

(c) 有 向 ， 无 加 权 : 鲍 勃 回复 了 查理 发 布 的 帖子 吗 ? 没有 。 查 
理 回 复 了 鲍 勃 发 布 的 帖子 吗 ? 是 的 ， 在 线程 I1V 中 。 所 以 查理 连接 至 
绝 勃 ， 但 鲍 勃 没有 连接 至 查理 。 

(d) 有 和 向， 加权: 鲍 勃 回复 了 查理 多 少 次 ? 零 次 。 查 理 回 复 了 
忽 皂 多 少 次 ? 一 次 。 所 以 从 查理 到 鲍 勃 的 链接 权重 为 1。 


在 对 其 余 的 学 生 对 儿 做 这 样 的 操作 后 《我 们 豆 励 你 这 样 做 ! ) ， 我 
们 会 得 到 图 8-9 所 示 的 内 容 。 在 有 问 的 情况 下 〈‘C 和 D)〉， 爱 丽 丝 和 鲍 动 


是 唯一 均 指 问 对 方 的 一 对 。 爱 丽 丝 回 复 了 鲍 肠 两 次 《线程 1 和 I 中 各 有 一 
次 ) ， 而 鲍 劲 回复 了 爱丽 丝 三 次 《线程 IT、I 和 TV 中 各 有 一 次 ) 。 


(a) pa 
无 回 无 加 权 无 回 加 权 


六 全 齐 
sf © YO 


(8) (d) 
有 问 无 加 权 有 问 加 权 
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心心 
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图 8-9 用 四 种 图 形 类 型 表示 图 8-8 中 的 可 社会 化 学 习 网 络 
学 生 与 线程 图 、 线 程 与 线程 图 ..………… 


使 用 学 生 作为 节点 有 助 于 表示 网 络 中 的 “ 谁 ”( 即 哪些 学 生 在 互 
动 ) ， 但 它 并 不 能 解释 “什么 ”( 即 谈话 中 正在 讨论 的 话题 。 这 也 是 需 
要 描述 的 重要 信息 ， 因 为 它 可 以 说 明 ， 例 如 什么 话题 讨论 得 最 多 或 容易 
把 人 弄 糊涂 。 


我 们 怎样 才能 发 现 关 键 话题 是 什么 ?原始 讨论 文本 的 未 加 工 形式 往 
往 太 长 ， 并 且 缺 乏 信 息 。 我 们 可 以 做 的 ， 是 从 自然 语言 处 理 (natural 
language processing) 中 采用 适当 的 方法 ， 提 取 基 于 文本 的 主题 。 


一 个 主题 提取 的 输出 内 容 示 例如 图 8-10 所 示 。 我 们 得 到 一 组 主题 ， 每 个 
都 由 茶 些 共同 出 现 的 关键 字 组 成 。 每 个 帖子 都 可 以 与 文本 中 包含 的 一 个 
(或 多 个 ) 主题 相关 联 。 


链接 节点 ”加 权 有 向 
节点 页 网 排名 


谷歌 排名 广告 竞拍 
图 8-10 从 论坛 中 提取 主题 时 可 得 出 信息 的 示例 


注 : 主题 由 共同 出 现 的 词汇 组 成 ， 每 个 帖子 都 与 其 最 突出 的 主题 相关 


我 们 怎么 能 推断 ， 是 否 每 个 学 生 都 倾 咎 于 就 特定 主题 提问 或 回答 
呢 ? 这 似乎 是 一 个 微不足道 的 问题 : 我 们 不 能 直接 检查 学 生 关 于 一 个 主 
题 的 帖子 是 人 否 包含 问号 吗 ? 不 笠 的 是 ， 这 没 那么 容易 ， 因 为 有 很 多 反 
例 ， 如 提问 时 不 使 用 问号 《例如 “请 给 我 解释 这 是 如 何 工 作 的 >) ， 以 问 
题 的 形式 提供 答案 《例如 “你 会 认为 它们 是 不 同 的 ， 对 吧 ? ”) ， 或 干脆 
没有 使 用 正确 的 标点。 


主题 提取 和 问题 检测 都 是 信息 检索 (information ” retrieval) 领 
域 的 研究 热点 。 请 放心 ， 这 些 功 能 的 高 质量 处 理 现在 已 经 存在 。 我 们 将 
假设 (i) 每 个 线程 独特 到 足以 表示 一 个 单独 的 话题 ; (ii) 我 们 已 经 准 
确 地 确定 哪些 帖子 “评论 ) 是 问题 ， 哪 些 是 答案 。 


我 们 如 何 体现 学 生 与 主题 之 间 的 关系 ? 我 们 可 以 将 视觉 效果 与 妨 一 
种 节点 结合 ， 每 个 话题 一 个 节点 ， 而 不 仅仅 是 描绘 图 中 的 学 生 。 回 到 图 
8-8 中 的 例子 ， 我 们 将 最 终 得 到 如 图 8-11 所 示 的 结果 。 在 这 里 ， 学 生 市 
点 在 顶部 ， 主 题 〈 线 程 ) 节点 在 底部 ， 每 个 链接 表示 学 生 加 入 主题 的 次 


数 。 
coo 


3 I “了 
af NR 


图 8-11 图 8-8 中 论坛 作为 连接 学 生 和 主题 的 偶 图 显示 


图 8-11 是 一 个 偶 图 (bipartite ”graph) : 它 有 两 组 独立 的 节点 
(这 里 是 学 生 和 主题 ) ， 每 个 链接 联系 一 组 中 的 一 个 节点 〈 即 一 个 学 
生 ) 和 另 一 组 中 的 一 个 节点 〈 即 一 个 主题 ) 。 这 个 图 是 加 权 的 ， 但 是 如 
果 我 们 只 是 对 学 生 是 否 讨 论 了 一 个 话题 感 兴趣 ， 我 们 可 以 把 权重 从 链接 
中 移 除 ， 得 到 一 个 无 加 权 偶 图 。 


在 这 张 图 里 ， 我 们 能 获得 许多 有 用 的 信息 。 我 们 可 以 看 到 ， 每 个 学 
生 讨 论 了 哪些 主题 ， 每 个 主题 有 哪些 学 生 讨 论 ， 以 及 其 被 讨论 的 频率 。 
它 没 有 揭示 的 一 点 是 每 个 学 生 的 帖子 的 性 质 : 它们 是 问题 还 是 答案 ? 例 
如 ， 我 们 可 以 看 到 ， 鲍 动 参与 了 每 一 个 主题 ， 共 有 7 个 帖子 ， 但 我 们 只 
有 回 到 图 8-8 才 能 知道 ， 提 问 和 回答 之 间 的 比例 大 致 是 1 : 1 (前 者 有 3 
个 ， 后 者 有 4 个 )。 在 寻找 网 络 的 简洁 表现 形式 时 ， 细 市 损失 是 我 们 付 
出 的 代价 。 


为 一 方面 ， 根 据 我 们 所 寻找 的 见解 ， 图 8-11 可 能 包含 太 多 与 关键 信 
娠 无 关 的 信息 。 如 果 我 们 想 知 道 两 个 学 生 在 所 讨论 的 话题 上 多 么 “ 相 
似 ”， 或 是 两 个 主题 对 于 参与 的 学 生来 说 多 么 “相似 " 呢 ? 解决 这 些 问题 
的 一 种 方法 是 利用 侦 图 中 的 共同 参与 计数 。 对 于 学 生 ， 我 们 考虑 每 对 学 
生 ， 统 计 两 人 都 发 帖 的 线程 数量 。 以 鲍 动 和 达 娜 为 例 ， 线程 II 是 他 们 唯 
一 都 发 帖 的 地 方 ， 因 此 他 们 的 共同 参与 值 为 1。 对 于 线程 ， 我 们 也 考虑 
每 一 对 ， 统 计 在 两 个 线程 中 都 及 帖 的 学 生 人 数 。 以 线程 I 和 IV 为 例 ， 爱 
丽 丝 和 鲍 莹 都 在 这 两 个 线程 中 友 帖 ， 所 以 他 们 的 共同 参与 值 是 2。 


对 其 他 每 一 对 重复 这 一 步 怠 ， 会 得 到 图 8-12 中 的 图 。 在 这 里 更 容易 
看 到 ， 例 如 ， 线 程 I 和 TIV 有 三 个 学 生发 了 相同 的 帖 ， 但 我 们 再 也 看 不 到 
哪 三 个 学 生 在 I 和 IV 中 都 发 帖 。 为 此 ， 我 们 必须 回 到 偶 图 ， 才 能 看 到 他 
们 是 爱丽 丝 、 鲍 用 和 查理 。 这 个 学 生 到 学 生 的 网 络 和 图 8-9 中 的 有 问 无 
加 权 图 一 样 ， 因 为 在 每 一 种 情况 下 ， 我 们 都 是 使 用 共同 参与 值 。 


图 8-12 图 8-11 偶 图 中 获得 的 学 生 到 学 生 ( 左 ) 和 线程 到 线程 ( 右 ) 的 共同 参 
与 图 
将 偶 图 划分 为 两 个 独立 的 图 形 ， 每 个 节点 集 一 张 图 ， 这 称 为 网 络 投 
影 (network projection) 。 根 据 投影 用 来 得 出 成 果 图 中 节点 之 间 的 
权重 的 规则 ， 可 以 区 分 不 同 的 投影 类 型 。 这 里 所 采取 的 类 型 称 为 简单 加 
权 ， 其 中 偶 图 的 各 个 链接 加 权 相 等 。 


对 社会 化 学 习 网 络 研究 进行 测试 


现在 我 们 已 经 了 解 了 一 些 类 型 的 图 表 ， 这 些 图 表 可 以 用 来 表示 社会 
化 学 习 网 络 的 不 同方 面 。 但 是 我 们 使 用 的 例子 中 的 网 络 规模 ， 比 真正 雁 
诬 论 坛 看 到 的 要 小 儿 个 量 级 。 这 些 图 表 在 实践 中 效果 如 何 ? 


现实 生活 中 的 社会 化 学 习 网 络 
我 们 将 看 一 看 我 们 自己 的 一 门 莫 课 的 讨论 示意 图 。 在 图 8-13 中 ， 我 


们 使 用 无 向 、 无 加 权 、 学 生 - 学 生 的 方法 ， 使 社会 化 学 习 网 络 实现 可 视 
他 


未 过 滤 的 边缘 更 有 用 的 表现 形式 
图 8-13 一 门 慕 课 课程 的 学 生 的 社会 化 学 习 网 络 


先 看 看 左边 的 图 。 两 个 学 生 之 间 的 链接 表明 他 们 至 少 参与 了 一 个 线 
程 。 虽 然 图 可 能 很 美观 ， 但 要 从 中 得 出 任何 有 意义 的 结论 相当 困难 ， 因 
为 节点 和 链接 的 数量 太 大 。 另 外 ， 我 们 只 显示 了 在 论坛 发 帖 不 止 一 次 的 
713 名 学 生 ， 否 则 ， 这 张 图 将 更 大 。 


要 发 现 关 于 社会 化 学 习 网 络 的 有 用 信息 ， 我 们 需要 “清理 ”这 一 图 
像 。 有 什么 可 行 的 方法 能 做 到 这 一 点 ? 想 想 我 们 可 以 如 何 利 用 线程 共同 
参与 计数 。 在 左边 ， 如 果 两 个 学 生 曾 经 共同 参与 线程 ， 我 们 会 将 他 们 连 
接 起 来 ， 要 是 将 连接 所 需 的 共同 参与 值 提 到 更 高 水 平 呢 ?这 将 移 除 图 中 
较 弱 的 连接 ， 使 我 们 能 够 找到 参与 程度 最 高 的 配对 。 在 右边 的 图 8-13 
中 ， 你 可 以 看 到 ， 将 连接 冰 值 设置 为 3 时 的 效果 。 现 在 我 们 可 以 清楚 地 
识别 ， 经 常 共同 参与 (至 少 成 对 ) 的 学 生 群 体 。 这 是 一 个 非常 简单 的 例 
子 ， 它 能 说 明 社 会 网 络 中 社团 发 现 (community detection) 的 出 发 
点 


Wyo 


人 们 应 该 明白 ， 在 葡 谍 中 的 社会 化 学 习 网 络 章 循 这 个 结构 。 庞 大 的 
规模 使 得 学 生 很 难 与 很 多 同伴 建立 联系 ， 即 使 是 在 共同 参与 的 同伴 中 ， 
异步 的 交流 形式 也 使 他 们 难以 维持 牢固 的 联系 。 


帮助 老师 与 帮助 学 生 


研究 社会 化 学 习 网 络 的 一 个 最 终 目 标 ， 是 找到 更 有 效 的 教学 方式 和 
学 习 方式 。 如 果 老 师 获 得 了 这 里 讨论 的 图 像 类 型 ， 他 们 能 更 有 效 地 完成 
哪些 任务 ? 


一 方面 ， 这 些 图 表 可 以 帮助 教师 识别 学 习 过 程 中 有 困难 的 学 生 。 那 
些 帝 毅 问 许多 问题 的 人 很 可 能 没有 从 和 内容 中 得 到 理想 的 学 习 体 验 。 在 这 
个 类 别 中 的 学 生 ， 在 加权、 定 癌 的 ) 学 生 -学 生 图 中 也 有 低 入 度 ， 他 
们 很 可 能 真 的 想 学 习 内 容 ， 但 没有 从 同伴 那里 得 到 所 需 的 帮助 (如 图 8- 
14 中 的 学 生 C，〉。 这 些 学 生 可 能 会 从 直接 指导 介入 中 获 荔 不 少 。 
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注 : 教师 可 利用 学 生 - 学 生 图 ， 找 到 社会 化 学 习 网 络 图 中 的 学 习 困 难 者 和 专家 


为 一 方面 ， 教 师 也 可 以 通过 这 些 图 像 识别 “学 生 老 师 ”。 正 确 回答 问 
题 的 学 生 不 仅 十 分 了 解 学 习 材料 ， 而 且 愿 意 帮 助 不 懂 的 学 生 。 在 学 生 - 


学 生 图 中 有 高 出 度 和 高 “重要 性 ”如 第 5 草根 据 网 页 级 别 的 定义 ) 的 人 
可 能 属于 这 个 类 别 《〈 例 如 图 8-14 中 突出 显示 的 节点 ) 。 老 师 可 以 要 求 这 
些 学 生 帮 助 一 些 学 习 有 困难 的 学 生 。 


这 些 图 像 还 可 以 帮助 老师 确定 ， 哪 些 课 程 主题 受到 学 生 最 多 (或 最 
少 ) 的 关注 。 老 师 可 能 会 想 把 上 自己 的 注意 力 集中 在 这 些 话题 上 。 学 生 - 


线程 偶 图 可 以 帮助 识别 这 些 ， 例 如 通过 确定 度数 最 高 的 线程 来 实现 。 


除了 回 老 师 显示 图 像 效果 ， 帮 助 他 们 得 出 结论 ， 会 有 一 些 发 现 目 动 
产生 吗 ? 尤其 是 那些 一 开始 就 更 容易 被 镶 能 机 事 识 别 的 及 现 。 例 如 ， 积 
极 研究 算法 ， 在 诬 程 早期 进行 预测 ， 看 看 学 生 以 当前 的 学 习 进 度 ， 最 终 
将 会 有 怎样 的 学 习 成 果 。 这 些 算法 中 ， 有 些 使 用 我 们 在 第 7 章 看 到 的 协 
同 过 小 ， 只 不 过 它 不 是 预测 用 户 对 电影 的 评级 ， 其 目的 是 预测 学 生 在 测 
验 、 在 学 生 论坛 中 ， 参 与 随 着 时 间 推 移 的 变化 或 其 他 相关 输出 的 表现 。 


最 近 ， 关 于 这 个 话题 的 有 趣 发 现 是 ， 学 生 行为 的 茶 些 特征 ， 特 别 是 
学 生 行 为 的 特定 顺序 ， 及 其 观看 讲座 视频 时 访问 的 地 点 ， 可 以 预测 其 会 
在 测验 和 考试 中 取得 的 成 绩 。 例 如 ， 最 近 的 研究 表明 ， 完 全 基于 学 生 在 
观看 视频 时 所 展示 的 行为 ， 预 测 其 能 否 正确 回答 问题 ， 可 能 达到 
709%6~80% 的 正确 率 。 如 果 在 读 程 开始 时 ， 计 算 机 就 标记 出 那些 预测 成 
绩 不 好 的 学 生 ， 那 么 老师 就 会 及 时 知道 应 该 帮助 谁 。 考 虑 到 最 终 未 能 完 
成 一 门 育 课 课 程 的 人 数 比 例 ， 将 正确 率 提 高 1%， 就 相当 于 提前 正确 识 
别 几 十 个 学 生 。 


可 视 化 、 推 荐 和 预测 只 是 三 种 社会 化 学 习 网 络 。 最 后 ， 请 记 住 ， 社 
会 化 学 习 网 络 的 效果 取决 于 一 个 概念 : 学 生发 布 问 题 将 促使 同伴 给 出 准 
确 答 案 。 社 会 化 学 习 网 络 的 可 持续 性 的 前 握 ， 是 希望 通过 大 量 学 习 者 的 
页 献 和 参与 的 融合 ， 使 学 生 的 需求 可 以 从 内 部 得 到 部 分 满足 。 


第 三 部 分 
后 


/AN 二 口 


在 本 书 的 这 一 部 分 ， 我 们 探讨 了 三 种 网 络 活 动 : 产品 评级 、 推 荐 
电影 和 社会 化 学 习 。 这 些 应 用 方式 看 似 多 样 ， 但 每 一 个 都 依赖 于 群众 
智慧 的 某 种 变化 形式 : 随 着 关于 某 些 事实 的 更 多 意见 或 知识 被 收集 ， 
在 适当 的 情况 下 ， 我 们 可 以 对 真实 情况 做 出 更 高 质量 的 估计 。 


在 第 6 章 中 ， 我 们 看 到 ， 群 众 智慧 是 一 个 有 效 的 工具 ， 它 能 根据 
一 组 用 户 评级 对 “地 面 实况 ”做 出 准确 估计 。 当 单个 样本 的 规模 不 够 
大 时 ， 可 以 使 用 贝 叶 斯 调整 等 技术 ， 将 其 与 更 多 人 口 进行 比较 。 我 们 
在 讨论 亚 马 过 产品 排名 背后 的 一 些 原则 时 ， 介 绍 了 这 些 工具 ， 不 过 它 
们 从 评级 到 排名 的 实际 公式 仍然 是 秘密 。 


然后 我 们 转向 第 7 章 中 的 推荐 问题 。 我 们 看 到 网 飞 如 何 通过 “ 读 
心术 ”游戏 ， 使 用 网 飞 已 收集 并 存储 在 数据 库 中 的 历史 电影 评级 ， 来 
预测 未 知 的 用 户 电 影评 级 。 我 们 探讨 了 网 飞 根据 特定 用 户 和 电影 历史 
形成 基线 背后 的 概念 ， 随 后 根据 不 同 用 户 或 不 同 电影 之 间 的 相似 之 处 
进行 调整 。 


最 后 ， 在 第 8 章 ， 我 们 探讨 了 社会 化 学 习 网 络 ， 这 是 学 生 之 间 在 
教育 话题 上 合作 形成 的 社会 化 网 络 类 型 。 我 们 讨论 了 慕 课 和 当前 的 研 
完 ， 以 表示 、 分 析 并 利用 在 这 些 场景 中 出 现 的 社会 化 学 习 网 络 。 社 会 
化 学 习 网 络 的 核心 是 希望 学 生 群 体 可 以 合作 ， 解 决 彼 此 的 问题 。 


第 四 部 分 
大 众 并 不 那么 聪明 


我 们 了 解 了 群众 的 智慧 ， 这 一 概念 表示 ， 相 比 个 人 决策 ， 从 大 量 
人 群 中 汇集 信息 往往 会 形成 更 好 的 决策 。 这 一 概念 假设 每 个 人 的 观点 
都 是 独立 的 。 它 们 在 什么 情况 下 不 是 独立 的 ? 当 它 们 不 独立 时 会 发 生 
什么 3 

事实 上 ， 在 许多 情况 下 ， 别 人 的 想法 会 影响 你 的 行为 。 就 像 你 看 
菜 个 YouTube 视 频 ， 是 因为 大 家 都 在 谈论 它 。 你 买 了 苹果 平板 电脑 ， 
是 因为 其 他 人 都 有 。 你 为 作业 问题 写 上 某 个 答案 ， 是 因为 你 的 同学 坚 


持 认 为 它 是 正确 的 。 此 外 ， 你 看 到 采取 这 种 行动 的 人 越 多 ， 你 就 越 可 
能 受到 驱使 来 做 同样 的 事情 。 


鉴于 这 种 行为 ， 我 们 在 本 书 这 一 部 分 的 重点 是 社会 网 络 中 意见 的 
依赖 性 。 在 第 9 章 ， 我 们 将 了 解 病毒 式 传播 ， 在 第 10 章 ， 我 们 将 讨论 
社会 影响 。 在 这 一 部 分 的 最 后 ， 你 可 能 会 相信 ， 在 某 些 情况 下 ， 影 响 
大 众 实际 上 是 相对 容易 的 。 


第 9 章 
让 视频 短片 变 成 "病毒 


在 用 户 生 成 视频 内 容 的 领域 ，YouTube 〈 见 图 9-1) 是 占 主导 地 位 
的 分 享 网 站 。 浏 览 它 的 视频 列表 ， 我 们 可 以 找到 的 视频 包括 精彩 的 体育 
赛事 短 族 、 上 自 记 为 YouTube 亏 术 家 的 音乐 ， 以 及 教育 专题 讲座 。 到 2015 
年 ，YouTube 上 每 天 有 数 亿 小 时 的 视频 被 收看 。 


orl Tube 


图 9-1 YouTube 商 标 标识 


在 关于 YouTube 的 描述 中 ， 你 可 能 听 过 病毒 式 传播 (vira- 
lization) 这 个 术语 。 你 可 能 想 知道 ， 视 频 短片 怎样 才能 实现 病毒 式 传 
播 ? 我 们 将 在 本 章 解 释 这 个 问题 。 与 此 同时 ， 我 们 会 认识 到 ，YouTube 
视频 浏览 是 一 个 通过 信息 传播 创造 依赖 关系 的 好 例子 。 


YouTube 和 病毒 式 传播 


在 进入 病毒 式 传播 的 讨论 前 ， 让 我 们 看 一 看 YouTube 的 演变 。 该 公 
司 于 2005 年 2 月 由 三 名 PayPal 前 员工 创立 。 自 成 立 以 来 ， 该 网 站 的 增长 
速度 非常 快 : 到 2006 年 7 月 ， 它 每 天 新 增 65 ”000 个 视频 和 1 亿 次 的 访问 
量 。 几 个 月 后 ， 在 2006 年 11 月 ， 该 公司 被 谷歌 以 16.5 亿 美元 收购 。 


在 短 短 几 年 之 内 ， 由 于 很 多 人 经 常 在 YouTube 上 看 视频 ， 这 让 该 网 
站 成 为 一 个 搜索 引擎， 它 的 规模 仅 次 于 谷歌 本 身 。YouTube 的 日 均 视 频 
观看 数 增长 情况 如 图 9-2 所 示 。2009 年 10 月 ， 该 数字 达到 10 亿 ; 到 2012 
年 1 月 ， 该 数字 增加 了 4 倍 。 如 果 你 曾经 体验 过 网 站 上 使 人 上 瓶 的 推荐 
栏 ， 你 就 不 会 对 这 种 增长 势头 感到 惊讶 ， 因 为 它 会 连续 不 断 地 将 相关 短 
片 推荐 给 观众 ， 你 一 次 要 看 上 几 个 小 时 才 会 退出 。 
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日 均 浏览 数 ( 10 亿 ) 
[2 
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图 9-2 


注 : 2009 年 到 2012 年 中 有 4 个 月 ，YouTube 的 日 均 视频 浏览 数 突破 新 的 10 亿 大 关 。 截 
至 2016 年 7 月 ， 这 一 数字 已 达到 近 50 亿 

到 2016 年 年 中 ， 每 天 有 超过 10 亿 人 访问 YouTube， 这 带 来 了 近 50 亿 
的 视频 浏览 量 。 平 均 每 分 钟 有 400 小 时 的 新 内 容 被 上 传 到 YouTube， 
天 有 长 达 近 66 年 的 新 内 容 。“〔 换 句 话说 ， 如 果 你 收集 了 未 来 24 小 时 内 上 
传 的 所 有 视频 ， 你 要 花 66 年 才能 看 完 它们 ! ) YouTube 已 经 成 为 一 种 病 


毒 式 现象 ， 这 和 该 网 站 上 的 视频 短片 的 目标 一 致 。 


是 什么 让 视频 实现 病毒 式 传播 ? 这 个 问题 没有 一 个 简单 的 答案 ， 但 
这 并 不 能 阻止 人 们 研究 它 


在 本 书 第 三 部 分 ， 我 们 讨论 了 网 站 如 何 捕获 和 存储 用 户 在 网 站 上 的 
行为 。YouTube 也 不 例外 : 它 可 以 记录 用 户 行为 ,包括 与 视频 播放 器 的 
交互 。 这 些 数 据 可 以 用 来 分 析 ， 以 了 解 人 们 如 何 观 看 视频 ， 以 及 哪些 视 
-~ 病毒 式 传播 。 一 些 被 YouTube 用 来 强调 整体 观看 行为 的 分 析 工 
有 具 ， 如 YouTube Insight， 已 向 公众 开放 使 用 。 


最 “ 刁 名 昭著 ”的 病毒 式 传播 视频 是 什么 ?是 《 江 丙 style》。 它 是 由 
歌手 PSY《〈 乌 叔 ) 演唱 的 4 分 钟 音乐 视频 ， 于 2012 年 7 月 发 布 。《 江 南 
style》 成 为 第 一 个 浏览 量 突破 10 亿 的 视频 ， 它 在 短 短 5 个 月 (到 2012 年 
12 月 ) 内 达到 该 数字 。 在 不 到 2 年 的 时 间 里 ， 这 一 数字 达到 了 20 亿 “到 
2014 年 5 月 )。 其 浏览 量 随 着 时 间 变 化 的 示意 图 由 YouTube 提 供 ， 如 图 
9-3 所 示 。 


自 2013 年 以 来 ， 另 外 12 个 YouTube 视 频 的 浏览 量 也 突破 了 10 亿 大 
关 。 截 至 2016 年 年 初 ， 浏 览 量 仅 次 于 《江南 style》 的 是 泰勒 .斯 威夫 特 
的 《空白 区 》 (Blank ”Space) ， 它 获得 13 亿 浏览 量 。 但 直到 本 书写 作 
时 ，《 江 南 style》 仍 是 唯一 达到 20 亿 浏览 量 的 视频 。 事 实 上 ， 当 它 于 
2014 年 12 月 达到 2 147 483 647 的 浏览 量 后 ，YouTube 似 乎 就 已 经 无 法 计 
算 浏览 量 了 ， 显 示 在 主页 的 数字 也 因此 复 然而 止 。 


(浏览 量 ) 

2 500 000 000 
2 000 000 000 
1 500 000 000 
1 000 000 000 
500 000 000 
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2013 年 1 月 2013 年 7 月 ” 2014 年 1 月 ” 2014 年 7 月 2015 年 1 月 ”2015 年 7 月 
图 9-3 
注 : PSY 演 喝 的 《江南 style》 音 乐 视频 在 YouTube 上 的 累计 浏览 量 随时 间 变 化 的 曲线 


为 什么 YouTube 计 数 会 停止 在 这 看 似 随 机 的 数字 上 ?其 实 这 是 使 用 
32 位 可 以 存储 的 最 大 数字 ， 是 YouTube 为 每 个 视频 计数 器 预 留 的 数量 。 
没有 人 预料 到 ， 一 个 视频 会 累积 达到 这 么 多 浏览 量 ， 以 至 于 32 位 存储 都 
不 够 。YouTube 迅 速 修复 这 个 问题 ， 升 级 到 64 位 计数 器 ， 将 最 大 值 提高 
至 9 223 372 036 854 775 808。 所 以 ， 在 PSY、 斯 威夫 特 或 其 他 人 的 视频 
浏览 量 达 到 100 万 的 三 次 方 之 前 ，YouTube 的 计数 器 应 该 是 安全 的 。 


把 观众 带 给 视频 


像 《 江 南 style》 这 样 的 视频 怎么 会 如 此 受 欢迎 呢 ? 要 回答 这 个 问 
题 ， 我 们 首先 可 以 看 看 引导 观众 点 击 YouTube 短 片 的 四 个 主要 途径: 


。 在 合 歌 等 网 站 上 ， 搜 索 包 含 视频 标签 的 词组 ; 

。 介绍 〈 例 如 来 自 电子 邮件 、 脸 书 或 推广 视频 的 广告 ) ; 
。 订阅 的 YouTube 频 道 发 布 该 视频 ; 

。 YouTube 边 栏 给 出 的 视频 推荐 。 


相 比 视频 的 “ 赞 " 和 “ 躁 ” 的 数量 ， 订 阅 和 推荐 对 决定 视频 受 欢 迎 程度 
往往 起 到 更 大 的 作用 。 订 阅 很 简单 易 懂 ， 但 YouTube 如 何 产 生 推荐 内 


容 ? 它 使 用 的 是 像 网 飞 推荐 电影 那样 的 协同 过 滤 算 法， 还 是 将 视频 片段 
按 “ 重 要 性 ”排名 的 网 页 级 别 式 的 算法 ? 


事实 证 明 ， 这 两 种 算法 在 该 应 用 上 都 转化 得 不 好 。 不 同 于 网 飞 的 电 
影 ，YouTube 视 频 的 长 度 和 生命 周期 通常 很 得， 并 且 观 看 行为 变化 大 ， 
很 难 建立 用 户 评级 视频 片段 的 持续 系统 。 对 于 网 页 级 别 算 法 ， 我 们 需要 
将 视频 厂 段 以 人 条 种 方式 “连接 ”在 一 起 〈 例 如， 通过 搜索 视频 描述 ， 找 到 
其 他 片段 的 超 链 接 ， 或 比较 不 同 视 频 的 标签 ， 找 到 匹配 关键 词 》。 但 是 
标签 和 描述 的 质量 是 相当 不 可 靠 的 。 


YouTube 视 频 推荐 被 认为 是 不 同 的 ， 也 要 简单 得 多 。 还 记得 ， 在 第 
8 章 ， 我 们 利用 学 生 在 讨论 线程 中 的 共同 参与 值 ， 对 学 生 之 间 的 链接 进 
行 加 权 ， 也 利用 学 生 之 间 的 链接 ， 对 学 生 在 讨论 线程 中 的 共同 参与 值 进 
行 加 权 吗 ? YouTube 记 录 视 频 对 儿 的 共同 访问 计数 (co-visitation 
count) ， 它 代表 某 个 最 近 的 时 间 窗 (如 过 去 24 小 时 〉 中， 两 个 视频 被 
同一 观众 观看 的 次 数 。 因 此 ， 如 果 在 过 去 的 某 一 天 ， 有 100 人 观看 了 A 
和 B 两 个 视频 ， 我 们 可 以 用 权重 100 连 接 A 和 B。 通 过 这 种 方法 ， 我 们 可 
以 构建 一 个 加 权 的 视频 -视频 图 。 你 可 以 在 图 9-4 中 看 到 一 个 示例 。 


YouTube 似 乎 采用 这 种 共同 访问 图 ， 并 将 其 与 视频 标题 、 标 答 和 摘 
要 中 的 关键 词 匹配 结合 ， 生 成 给 你 的 推荐 。 人 们 也 注意 到 ， 往 往 只 有 那 
些 观 看 计数 与 当前 视频 接近 或 略 高 的 视频 才 会 显示 在 推荐 页 面 。 这 使 得 
被 广泛 观看 的 视频 更 容易 广泛 传播 : 这 是 一 个 正 反 馈 ! 


〇 ”= 视频 
@ 〇 = 两 个 视频 均 被 50 人 观看 


图 9-4 YouTube 推 荐 利用 视频 之 间 的 共同 访问 计数 
注 : 图 中 每 个 节点 都 是 一 个 视频 ， 链 接 的 权重 是 在 一 定时 间 内 观看 了 这 两 个 视频 的 
人 数 


定义 病毒 式 传播 
病毒 式 传播 到 底 是 什么 意思 ? 虽然 没有 普遍 接受 的 定义 ， 但 它 通 ? 


第 
表示 ， 视 频 的 总 浏览 量 随 时 间 变 化 的 趋势 ， 如 图 9-5 中 的 曲线 〈c) 。 这 
里 有 三 个 重要 特征 : 


迅速 开始 快速 增长 时 间 
快速 增长 持续 时 间 长 


图 9-5 视频 总 浏览 量 随 时 间 变 化 的 典型 趋势 
注 : 视频 (a) 保持 在 低 水 平 。 视 频 (b) 迅速 上 上升， 但 随后 迅速 放 缓 。 视 频 (c) 在 
长 时 间 内 增长 较 快 ， 并 保持 一 段 时 间 
1， 总 浏览 计数 高 ; 


2. 持续 足够 时 间 的 迅速 增长 ; 
3. 《有 了 时) 短 时 间 后 开始 快速 增长 。 


没有 黄金 公式 可 以 让 你 遵循 ， 以 确保 你 的 视频 将 实现 病毒 式 传播 。 
不 过 ， 已 建立 的 信息 传播 (information spread) 模型 可 以 就 病毒 式 
传播 发 生 的 原因 带 来 有 趣 的 见解 。 这 些 理想 化 的 模型 已 经 被 用 来 分 
析 “ 项 目 ”( 范 围 从 实体 产品 到 疾病 在 人 群 中 的 传播 。 把 YouTube 视 频 
看 成 项 目 ， 我 们 将 很 快 看 到 本 章 中 一 个 简单 但 有 启发 性 的 信息 传播 模 
型 。 


受 欢迎 程度 


让 我 们 先 考 虑 吸引 人 们 选择 作 个 项 目的 因素 。 其 中 之 一 当然 是 该 项 


目 带 给 人 的 内 在 价值 (intrinsic value) 。 有 些 人 可 能 喜欢 它 ， 不 管 别 
人 怎么 想 。 


然而 ， 在 许多 情况 下 ， 一 个 人 获得 某 个 项 目的 决定 将 取决 于 其 他 人 
做 了 什么 。 网 络 效应 (network effect) 有 两 个 可 能 发 生 的 原因 。 首 
先 ， 服 务 或 产品 的 价值 可 能 取决 于 使 用 它 的 人 数 。 如 果 别 人 都 没有 电 
话 ， 它 对 你 有 什么 用 呢 ? 如 果 你 是 唯一 使 用 过 脸 书 的 人 ， 它 还 会 这 么 有 
趣 吗 ? 这 些 产品 和 服务 具有 积极 的 网 络 效应 (Positive network 
effect) : 使 用 它们 的 人 越 多 ， 它 们 对 每 个 人 就 变 得 越 有 价值 。 


第 二 ， 知 道别 人 对 一 个 项 目的 看 法 会 影响 你 的 决定 。 你 有 没有 因为 
朋友 告诉 你 某 部 电影 好 而 看 它 ， 不 管 它 是 否 是 你 平时 喜欢 的 类 型 ? 在 这 
些 情况 下 ， 人 们 的 意见 和 决定 受到 他 人 的 影响 。 和 群众 不 再 像 第 三 部 分 那 
样 “ 明 智 > 了 ， 因 为 我 们 在 那里 关于 独立 诀 策 的 假设 不 再 成 也。 结果 反而 
是 群众 的 廖 误 (fallacy of crowds) 。 


这 些 因素 中 的 哪个 适用 于 在 YouTube 上 选择 观看 视频 的 人 ? 网 站 本 
号 确 实 有 积极 的 网 络 效应 ， 但 这 并 没有 真正 影响 菜 人 是 人 否 会 选择 观看 茶 
个 视频 。 更 具 影 响 力 的 是 其 他 两 个 成 分 〈 见 图 9-6) : 该 视频 片段 对 此 
人 的 内 在 价值 《 即 是 否 符合 他 的 喜好 ) ， 以 及 群众 的 诬 误 〔 即 他 是 否 
到 很 多 其 他 人 观看 该 视频 ) 。 后 者 基于 将 视频 浏览 通过 人 和 群 传播 的 网 络 
效应 ， 因 此 对 视频 病毒 式 传播 的 影响 较 大 。 
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图 9-6 
注 : 影响 YouTube 视 频 受 欢迎 程度 的 两 个 因素 是 其 内 在 价值 和 网 络 效 应 


对 网 络 效应 进行 量化 并 非 易 事 ， 这 取决 于 个 人 、 项 目 和 兴趣 情况 。 
接 下 来 ， 我 们 将 看 一 个 信息 瀑布 (information cascade) 模型 ， 这 
是 一 个 群众 廖 误 的 简单 例子 。 


Y 


如 果 你 看 见 有 人 站 在 街角 仰望 天 空 ， 你 会 怎么 做 ? 你 可 能 会 认为 她 
流 异 血 了 ， 然 后 继续 做 目 己 的 事 。 但 是 ， 如 采 你 看 到 10 个 人 站 在 一 起 仰 
望 天 空 ， 如 图 9-7 所 示 ， 你 会 怎么 做 ? 那 你 可 能 会 停 下 来 看 ， 认 为 可 能 
出 什么 事 了 。 这 个 人 的 行为 会 使 人 群 变 得 更 大 ， 下 一 个 经 过 的 人 将 看 到 
11 个 人 ， 更 会 妨 不 住 停 下 来 看 。 


图 9-7 所 有 人 都 站 在 街角 仰望 天 空 
注 : 这 会 让 路 过 的 人 认为 有 可 能 出 什么 事 了 ， 使 他 们 也 跟着 看 


这 是 一 个 典型 的 信息 瀑布 的 例子 ， 人 们 跟随 人 群 的 行动 ， 而 忽略 目 
己 的 内 部 动因 。 当 关于 意见 的 独立 性 假设 〈 本 书 第 三 部 分 群众 智慧 的 前 
提 ) 不成立 ， 信 息 瀑布 便 会 出 现 。 事 实 上 ， 它 体现 了 截然 相反 的 情况 : 
决策 过 程 不 是 完全 独立 的 ， 而 是 完全 取决 于 之 前 发 生 过 什么 。 


关于 信息 瀑布 的 所 有 实例 估计 能 写 一 整 本 书 : 从 股票 市 场 泡沫 到 时 
疝 潮 流 ， 再 到 历史 上 集权 主义 政权 的 瓦解 。 和 它们 如 何 被 应 用 到 视频 的 病 
毒 式 传播 ? 你 更 可 能 会 遇 到 一 个 已 经 流行 的 视频 ， 即 使 它 不 符合 你 的 口 
味 ， 你 可 能 还 是 会 忍 不 住 想 看 看 它 是 怎么 回 事 。 如 采 你 不 喜欢 它 ， 可 能 
会 决定 停止 观看 ， 但 这 仍然 会 计 入 视频 劳 边 显 示 的 浏览 数量 ， 并 部 分 决 
定 其 在 推荐 页 的 位 置 。 更 高 的 浏览 计数 将 反 过 来 影响 更 多 的 人 ， 并 且 这 
种 累积 还 在 继续 。 


依次 做 出 决策 


我 们 需要 看 看 最 终 触发 信息 瀑布 的 过 程 。 在 顺序 决策 (sequential 
decision ” making) 中 ， 每 个 人 得 到 一 个 私人 信号 〈 例 如 ， 我 的 时 子 
开始 流血 ) ， 并 采取 一 个 公开 动作 《〈 人 例如， 抬头 望 向 天 空 》。 随 后 的 用 


户 可 以 观察 到 公开 动作 而 不 是 私人 信和 号。 如果 此 时 有 足够 多 的 同一 类 型 
的 公开 动作 例如 ， 有 10 个 人 仰望 天 空 ，， 那 么 所 有 后 来 的 用 户 将 忽略 
目 己 的 私人 信号 ， 只 会 模仿 别人 的 动作 。 此 时 ， 信 息 瀑 布 极 触发。 


多 少 公开 动作 才 够 触发 信息 瀑布 ? 这 取决 于 当前 情况 。 例 如 ， 相 比 
让 人 们 仰望 天 空 ， 要 让 所 有 人 都 看 你 的 YouTube 视 频 可 能 会 难得 多 。 这 
也 取 雇 于 所 涉及 的 人 。 如 果 人 们 更 愿意 把 他 人 的 公开 动作 作为 动因 ， 那 
么 信息 瀑布 就 可 以 更 快 启动 。 


言 息 瀑布 可 以 通过 正 反 馈 (positive ”feedback) 扩展 到 更 大 规 
模 。 你 可 以 在 图 9-8 中 看 到 这 一 点 : 更 多 的 人 表现 出 相同 的 公开 动作 ， 
给 下 一 个 人 更 多 跟随 的 动力 ， 这 使 得 群体 变 得 更 大 ， 从 而 提供 更 多 动 
力 ， 以 此 类 推 。 还 记得 我 们 在 本 书 第 一 部 分 对 负 反 馈 的 讨论 吗 ? 正 反馈 
与 此 相反 。 在 前 者 中 ， 我 们 系统 地 抵消 某 种 效果 以 达到 网 络 中 的 平衡 
《例如 通过 第 1 章 的 分 布 式 功率 控制 或 第 3 章 的 基于 使 用 的 定价 ) 。 在 后 
者 中 ， 该 效果 依靠 自己 持续 的 影响 力 产生 更 多 影响 ， 并 继续 增长 。 这 两 
种 类 型 的 反馈 都 是 网 络 中 的 重要 主题 。 


每 个 人 都 边 循 的 公开 动作 是 正确 的 还 是 错误 的 ? 两 者 都 有 可 能 ， 错 
误 的 信息 瀑布 〈“ 例 如， 每 个 人 都 在 仰视 ， 但 天 空中 没有 什么 有 趣 的 东 
西 ) 是 群众 请 误 的 缩影 。 但 信息 瀑布 也 古 脆 弱 的 : 即使 一 些 私 人 信号 被 
泄露 给 公众 例如， 在 街道 的 扎 角 处 有 一 个 人 大 喊 :“ 我 在 仰望 天 空 ， 
因为 我 流 蜡 血 了 ! ”) ， 它 也 可 能 会 迅速 消失 ， 甚 至 逆转 方 辐 。 为 什 
么 ? 因为 人 们 在 跟随 人 群 ， 尽 管 许多 人 在 做 同样 的 事情 ， 但 他 们 对 目 己 
在 做 的 事情 几乎 没有 信心 。 
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图 9-8 顺序 决策 中 的 正 反 馈 
注 : 随 着 采取 相同 公开 动作 的 人 数 坪 加 ， 下 一 个 人 会 更 忍 不 住 模 念 该 动作 ， 使 采取 
该 动作 的 人 数 增加 ， 以 此 类 推 
多 年 来 ， 人 们 提出 了 几 种 顺序 决策 的 模型 。 接 下 来 我 们 将 看 看 一 个 
简单 的 模型 。 


假设 有 一 群 人 排队 玩 一 个 猜 数 字 游 戏 。 主 持 人 选择 数字 0 或 1 作为 正 
确 答案 。 每 次 会 有 一 个 人 走 上 黑板 ， 写 下 目 己 猜 训 的 数字 《图 9-9) 。 


当 一 个 人 走 上 黑板 ， 主 持 人 会 向 其 展示 一 张 卡片 ， 上 面 写 
着 “0” 或 “1”。 这 是 此 人 的 私人 信号 。 如 果 正 确 答案 是 “0”， 主 持 人 有 比如 
80% 的 概率 会 选择 有 “0” 的 卡片 ， 有 20% 的 概率 选择 有 “1” 的 卡片 。 如 果 
答案 是 “1”， 主 持 人 有 80% 的 概率 会 选择 有 “1” 的 卡片 ， 有 20% 的 概率 选 
择 有 “0” 的 卡片 。 显 示 的 数字 不 一 定 是 正确 的 ， 但 是 每 个 人 都 被 告知 ， 


他 们 看 到 的 卡 卢 正确 比 错误 的 概率 更 高 。 


Ot 


图 9-9 
注 : 在 这 个 思想 实验 中 ， 一 些 人 排 好 队 ， 每 次 会 有 一 个 人 被 叫 到 黑板 上 写 下 自己 的 
猜测 。 这 有 可 能 是 当 第 三 个 人 上 去 时 ， 黑 板 的 样子 
黑板 上 每 个 人 的 猜测 都 是 其 公开 动作 。 当 有 人 进行 猜测 时 ， 她 会 看 
到 前 面 所 有 人 的 公开 动作 ， 但 没有 看 到 癌 他 们 显示 的 私人 信和 号。 作为 示 
例 ， 图 9-9 和 9-10 显 示 了 ， 当 第 三 人 走 上 黑板 时 的 情况 : 
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图 9-10 
注 : 第 三 人 看 到 前 两 人 的 公开 动作 〈 公 开 1 和 公开 11) ， 并 得 到 自己 的 私人 信号 〈 私 


人 111) 。 根 据 这 些 信息 ， 她 在 黑板 上 写 下 自己 的 猜测 〈 公 开 111) 
。 她 看 到 一 张 卡 片上 的 私人 信号 ， 我 们 称 之 为 私人 111。 
她 看 到 了 前 两 个 用 户 在 黑板 上 的 公开 动作 ， 我 们 称 之 为 公开 
1 和 公开 11。 
根据 这 些 信 息 ， 她 的 任务 是 做 出 自己 的 猜测 一 一 公开 111， 
并 写 在 黑板 上 。 


假设 爱丽 丝 是 第 一 个 上 去 的 人 。 她 该 怎么 办 呢 ? 目 前 黑板 上 还 没有 
内 容 ， 所 以 她 只 能 依靠 卡片 上 的 数字 。 她 知道 这 个 数字 更 可 能 是 对 的 。 
所 以 如 果 她 看 到 0， 她 会 号 0， 如 有 果 她 看 到 1， 她 会 写 1 


鲍 动 第 二 个 上 去 。 他 的 情况 和 爱丽 丝 有 什么 不 同 ? 他 不 仪 看 到 爱丽 
丝 写字 的 公开 动作 (公开 I)〉 和 他 自己 的 私人 信号 〈 私 人 II) ， 还 知道 爱 
丽 丝 如 何 分 析 。 他 看 不 到 她 的 私人 信号 ， 但 知道 它 一 定 和 公开 I 一 样 ， 
因为 爱丽 丝 进行 猜测 时 没有 其 他 信息 。 所 以 鲍 勃 实际 上 知道 两 个 私人 信 
号 ， 私 人 I 和 私人 II: 


如 果 它 们 都 是 0， 那 么 显然 他 会 写 下 0。 这 比 爱 丽 丝 面 对 的 情 
况 更 有 利 。 
。 如 果 它 们 都 是 1， 那 么 同样 ， 他 也 会 写 下 1。 
但 是 ， 如 果 它 们 不 一 样 呢 ? 那 他 就 没有 提示 表明 哪个 数字 更 
可 能 是 正确 的 。 他 的 卡片 和 她 的 相互 矛盾 。 在 这 种 情况 下 ， 他 会 抛 
硬币 ， 随 机 写 下 0 或 1。 


现在 是 信息 瀑布 出 现 的 第 一 种 情况 。 当 第 三 个 人 卡拉 上 去 猜测 ， 她 
有 什么 信息 ? 她 有 一 个 私人 信号 〈 私 人 II) ， 以 及 两 个 公开 动作 〈 公 开 
I 和 公开 II) 。 卡 拉 需 要 比较 公开 I 和 公开 II。 


首 移 ， 如 宋 它 们 是 不 同 的 呢 ? 那 卡拉 就 知道 爱丽 丝 和 鲍 艺 的 私人 信 
号 肯定 也 古人 不同 的 。 鲍 动 一 定 发 现 了 信息 不 匹配 ， 并 随机 猜测 。 这 两 个 
相互 冲突 的 私人 信和 号 互相 抵消 ， 使 卡拉 处 于 和 第 一 个 人 爱丽 丝 相同 的 情 
况 。 然 后 她 仅 基 于 目 己 的 私人 信号 〈 私 人 IIT) 进行 猜测 。 


那么 ， 如 末 公 开 I 和 公开 II 是 相同 的 呢 ? 


如 果 卡 拉 的 私人 111 与 其 一 致 ， 那 么 结果 显而易见 : 她 知道 
有 两 个 信号 说 出 她 的 数字 〈 她 和 爱丽 丝 的 ) ， 另 一 个 可 能 也 一 臻 
〈 鲍 勃 的 ) 。 所 以 ， 她 应 该 选择 这 个 数字 作为 公开 111。 

这 里 是 真正 有 意思 的 地 方 。 如 果 卡 拉 的 私人 111 与 公开 1 和 公 
开 11 不 一 致 ， 她 的 猜测 最 好 是 无 视 她 的 私人 信号 ， 而 和 前 两 个 公开 
动作 保持 一 致 ! 


所 以 如 果 前 两 个 人 爱丽 丝 和 鲍 劲 ) 写 下 相同 的 猜测 ， 那 么 信息 深 
布 就 启动 了 。 第 三 个 人 (卡拉 ) 的 理性 选择 是 与 大 家 保持 一 致 。 如 果 第 
三 个 人 这 样 做 ， 那 么 第 四 个 人 也 会 这 样 ， 以 此 类 推 〈 直 到 发 生 其 他 事 来 
打破 信息 瀑布 )。 


为 什么 信息 瀑布 会 在 前 两 个 人 后 出 现 ? 让 我 们 在 逻辑 上 进行 分 解 。 
卡拉 知道 爱丽 丝 的 私人 信号 是 什么 。 由 于 对 方 和 她 的 不 同 ， 两 者 将 抵 
消 ， 所 以 卡拉 的 决定 可 归结 为 她 对 鲍 动 私人 信号 的 推测 是 什么 。 回 到 他 
的 决定 ， 有 两 种 方式 能 让 他 的 公开 动作 和 爱丽 丝 的 一 致 : 


1.” 鲍 勃 的 私人 1 与 爱丽 丝 的 公开 1 一 致 〈 这 意味 着 绝 勃 的 公开 
动作 是 其 私人 信号 ) ; 

2. 鲍 勃 的 私人 1 与 爱丽 丝 的 公开 | 不一致 ， 但 是 当 他 随机 选择 
时 ， 他 决定 写 下 公开 1 〈 这 意味 着 鲍 勃 的 公开 动作 不 是 其 私人 信 
二 


第 一 种 情况 更 有 可 能 。 所 以 ， 鲍 动 更 可 能 以 他 的 私人 信号 作为 猪 
测 。 因 此 ， 卡 拉 的 最 佳 选择 是 以 公开 I 作为 其 猜测 ， 这 样 束 形成 了 信息 
瀑布 。 


要 是 前 两 个 人 之 后 没有 出 现 信息 瀑布 呢 ? 那么 一 切 重 新 开始 ， 信 息 
瀑布 同样 可 以 在 接 下 来 的 两 个 人 之 后 出 现 ， 或 是 后 面 两 个 人 之 后 ， 以 此 
类 推 。 所 需要 的 是 ， 茶 个 处 于 偶数 顺序 的 人 采取 和 她 前 面 奇 数 顺序 的 人 
同样 的 公开 动作 。 在 图 9-11 中 ， 在 第 三 个 和 第 四 个 人 采取 公开 动作 1 之 
后 ， 出 现 了 1 的 信息 瀑布 。 


图 9-11 
注 : 当 第 三 个 人 和 第 四 个 人 的 猜测 都 为 1 时 ， 便 会 触发 信息 瀑布 


形成 信息 课 布 


我 们 要 多 久 才能 形成 信息 瀑布 ? 打破 信息 瀑布 有 多 容易 ? 我 们 将 在 
本 部 分 通过 猿 数 字 实 验 的 一 些 数值 例子 ， 探 讨 这 些 问 题 。 如 果 你 愿意 ， 
也 可 以 跳 过 下 面 的 计算 ， 直接 进入 下 一 部 分 。 


第 一 对 猜测 者 


在 我 们 的 实验 中 ， 爱 丽 丝 和 鲍 动 古 第 一 对 进行 猪 测 的 人 。 假 设 主持 
人 已 经 决定 将 1 作为 正确 答案 ， 她 回 每 个 人 展示 1 作为 其 私人 信号 的 概率 
征 80%〈 我 们 称 之 为 主持 人 的 概率 ) 。 


要 分 解 不 同类 型 的 瀑布 ， 最 简单 的 方法 是 通过 如 图 9-12 中 的 树 形 
图 ， 它 显示 了 基于 爱丽 丝 和 鲍 勃 私人 信号 的 6 种 不 同 可 能 性 。 其 中 ， 两 
种 可 能 性 导致 不 正确 的 信息 瀑布 〈 艾 为 公开 动作 0) ， 两 种 导致 正确 的 
言 息 瀑 布 〈 均 为 公开 动作 1) ， 两 种 不 会 导致 信息 瀑布 (公开 动作 不 
同 ) 。 例 如 ， 私 人 I = 1， 私 人 I = 0， 抛 硬币 = 1， 导 致 爱丽 丝 得 到 (并 
猜测 ) 1， 然 后 鲍 勃 得 到 0， 抛 便 币 并 猜测 1， 然 后 触发 正确 的 信息 瀑布 
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图 9-12 前 两 个 猜测 者 所 有 可 能 发 生 的 情况 
注 : 四 种 突出 显示 的 情况 将 触发 信息 瀑布 


在 回合 结束 时 ， 没 有 触发 信息 瀑布 的 概率 是 多 少 ? 要 使 这 种 情况 发 
生 ， 我 们 需要 前 两 个 公开 动作 不 同 ， 也 就 是 〈i) 公开 I = 0 且 公 开 I = 1 
或 Gi) 公开 I = 1 且 公 开 I = 0。 从 图 中 ， 你 可 以 看 到 ， 对 于 下 列 组 合 的 
私人 信号 ， 将 出 现 这 些 情况 : 


。 (i) 私人 1= 0， 私 人 11 = 1， 抛 硬币 = 1: 爱丽 丝 得 到 私人 
信号 0 的 概率 是 多 少 ? 由 于 看 到 1 的 概率 是 80%， 因 此 得 到 0 的 概率 是 
20%。 那 么 ， 绝 勃 得 到 1 的 概率 是 多 少 ? 80%。 抛 硬币 得 到 1 的 概率 是 
多 少 ? 50%。 因 为 这 三 个 独立 事件 中 的 每 一 个 都 必须 发 生 ， 因 此 我 们 
将 它们 相 乘 ， 得 到 发 生 这 种 情况 的 总 概率 : 0.20X0.80X0.5 二 
0. 08， 或 8%。 

。 (ii) 私人 1= 1， 私 人 11 = 0， 抛 硬币 = 0: 这 是 我 们 刚刚 
看 到 的 思路 的 北向。 爱丽 丝 看 到 1 的 概率 是 多 少 ? 80%。 鲍 勃 看 到 0 的 
概率 是 多 少 ? 20%。 抛 硬币 得 到 0 的 概率 是 多 少 ? 50%。 这 些 概率 得 到 
相同 的 结果 : 0. 20X0.80X0.5 = 0.08， 或 8%。 


由 于 (i) 和 (Gi) 都 没有 产生 信息 瀑布 ， 因 此 我 们 将 它们 相 加 ， 得 
到 总 概率 : 8% + 8% = 16%。 


言 息 瀑 布 发 生 的 概率 是 多 少 ? 答案 很 简单 : 16% 是 它 不 发 生 的 概 
率 ， 所 以 100% - 16% = 84% 是 发 生 的 概率 。 我 们 能 进一步 分 解 这 个 84% 
吗 ? 是 的 ， 因 为 可 能 发 生 两 种 不 同 的 信息 瀑布 : 正确 (1) 或 不 正确 
(0) 。 请 记 住 ， 不 正确 的 信息 瀑布 是 这 个 模型 中 的 群众 座 误 的 缩影 。 


要 得 出 这 些 概 率 ， 在 图 9-13 中 ， 六 种 不 同 结果 将 被 分 解 。 对 于 每 一 
种 情况 ， 我 们 沿 着 分 支 把 概率 相 乘 : 例如 ， 私 人 I 为 0O 有 20% 的 概率 ， 私 
人 II 为 1 有 80% 的 概率 ， 抛 硬币 得 到 0 有 50% 的 概率 ， 因 此 这 一 系列 事件 
发 生 的 概率 为 0.2x0.8x0.5 = 0.08， 或 8%。 把 相关 可 能 性 相 加 ， 正 确信 息 
瀑布 发 生 的 概率 是 64% + 8% = 729%， 不 正确 信息 瀑布 发 生 的 概率 是 49% 
+ 8% = 12%。 
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注 : 我 们 例子 中 的 六 种 结果 ， 每 个 发 生 的 概率 都 显示 在 树 形 图 右 便 


出 现 正 确信 息 瀑 布 的 概率 是 相当 高 的 。 为 什么 ? 还 记得 我 们 在 开始 
时 对 主持 人 做 的 假设 吗 ? 他 有 80% 的 概率 向 每 个 人 显示 正确 的 私人 信和 号 
(1) 。 那 也 相当 高 。 如 果 我 们 降低 该 数值 ， 事 实证 明 ， 不 正确 的 信息 
瀑布 和 不 出 现 信息 瀑布 都 将 变 得 更 有 可 能 。 更 多 关于 这 上 段 关 系 和 更 详细 
计算 过 程 的 信息 ， 请 参考 本 书 网 站 Q9.1 和 Q9.2 部 分 。 


未 来 的 猜测 对 儿 


在 爱丽 丝 和 鲍 靳 之 后 ， 不 出 现 信息 尘 布 的 概率 是 16%。 那 么 在 卡拉 
之 后 怎么 样 ? 请 记 住 ， 第 三 个 人 上 自 喘 不 能 触发 信息 滩 布 。 如 果 鲍 动 之 后 
没有 触 太 ， 那 么 卡拉 又 从 头 开 始 〈 没 有 信息 ) ， 和 爱丽 丝 的 处 境 相 同 。 
所 以 在 前 三 个 人 之 后 ， 不 出 现 信息 瀑布 的 概率 仍然 是 16%。 


达 娜 之 后 会 怎么 样 ? 现在 可 以 触发 信息 瀑布 的 方式 有 两 种 : 一 种 是 
在 爱丽 丝 和 鲍 勃 之 后 ， 另 一 种 是 在 卡拉 和 达 娜 之 后 。 要 在 他 们 之 后 不 产 
生 信 息 瀑 布 ， 我 们 需要 第 一 对 《爱丽 丝 和 鲍 勃 ) 和 第 二 对 (卡拉 和 达 
娜 》 都 不 触发 。 我 们 将 每 对 参与 者 不 形成 信息 瀑布 的 概率 相 乘 : 
0.16x0.16 = 0.0256， 或 2.56%。 因 此 ， 在 达 娜 之 后 ， 有 超过 97% 的 概率 
会 形成 信息 瀑布 。 


那么 埃 文 之 后 呢 ? 作为 第 三 对 中 的 第 一 个 人 ， 他 不 会 触发 信息 瀑 
布 ， 所 以 概率 保持 不 变 : 2.56%。 弗 兰 克 之 后 呢 ? 现在 我 们 有 三 个 产生 
言 姑 瀑布 的 概率 ， 分 别 是 鲍 勃 、 达 娜 和 弗兰克 之 后 ， 所 以 我 们 乘 三 次 : 
0.16x0.16x0.16 = 0.0041， 或 0.41%。 这 个 不 产生 信息 瀑布 的 概率 很 小 。 


现在 你 可 能 找 出 规律 了 ， 如 图 9-14 所 示 。 为 了 算出 第 “N” 对 后 仍然 
没有 信息 瀑布 的 概率 ， 我 们 将 0.16 乘 以 “N” 次 。 对 于 5 对 ， 它 变 成 
0.16x0.16x0.16x0.16x0.16 = 0.000 105〔( 即 约 1/100 的 1%) 。 对 于 50 对 ， 
小 数 点 后 第 一 个 有 效 数 字 之 前 有 37 个 零 ! 
一 一 没有 形成 信息 瀑布 的 概率 一 
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注 : 在 猜 数 字 实验 中 ， 随 着 更 多 参与 者 进行 猜测 ， 没 有 形成 信息 瀑布 的 概率 会 降低 


显然 ， 这 个 概率 正 迅速 趋 于 零 。 所 以 在 几 对 之 后 ， 我 们 差不多 确定 
会 产生 信息 瀑布 。 此 时 ， 未 来 人 们 的 决定 已 经 完全 取决 于 目前 的 情况 。 


但 请 记 住 ， 信 息 瀑 布 可 能 正确 ， 也 可 能 不 正确 。 在 某 一 对 进行 猜测 
后 ， 我 们 可 以 计算 出 每 一 种 结果 的 可 能 性 吗 ? 是 的 ， 但 相 比 反复 相 乘 ， 
这 些 公 式 需 要 更 多 的 数学 计算 。 事 实证 明 ， 进 行 猜测 的 参与 者 对 数 不 会 
在 很 大 程度 上 改变 每 种 信息 瀑布 类 型 的 概率 。 例 如 ， 当 主持 人 的 概率 为 
80% 时 ， 错 误 信息 瀑布 的 概率 从 一 对 后 的 12% 上 升 至 三 对 后 的 约 15%， 
而 正确 信息 瀑布 的 概率 从 约 72% 上 升 至 约 85%。 正 确信 息 瀑布 仍然 明显 
更 有 可 能 。 


无 论 有 多 少 对 数 ， 主 持 人 的 概率 都 是 影响 信息 瀑布 类 型 的 唯一 因 
素 。 例 如 ， 如 果 主 持 人 的 概率 下 降 到 60%， 最 终 产生 错误 信息 瀑布 的 概 
率 将 超过 359%， 产 生 正 确信 息 瀑 布 的 概率 将 低 于 65%。 当 主持 人 的 概率 
为 50% 时 ， 两 者 将 同样 可 能 出 现 ! 


要 了 解 这 些 关 系 的 详细 图 示 ， 请 参考 本 书 网 站 Q9.3 部 分 。 可 以 说 ， 
如 果 我 们 的 目标 是 触及 正确 的 信息 汉 布 ， 我 们 必须 希望 主持 人 更 为 频繁 
地 展示 正确 的 数值 而 非 错 误 的 。 这 一 点 有 些 不 合 第 理 ， 因 为 当 参 与 者 的 
对 数 很 大 时 ， 我 们 预计 能 获得 大 量 信息 〈 即 更 多 的 公开 动作 ) ， 正 确 的 
信息 瀑布 应 该 很 可 能 会 产生 。 但 信息 瀑布 阻碍 了 独立 信息 的 聚集 ， 这 对 
我 们 在 第 三 部 分 关于 群众 智 意 的 讨论 十 分 重要 。 只 需要 一 对 参与 者 展示 
两 个 0 或 两 个 1， 就 能 使 未 来 所 有 的 公开 动作 都 变 得 坚 无 意义 。 


星 融 的 新 衣 


现在 你 知道 ， 信 息 瀑 布 的 形成 是 多 么 容易 。 一 旦 被 触发 ， 信 息 瀑 布 
会 持续 多 久 ? 答案 是 永远 ， 除 非 出 现 茶 种 干扰 《如 泄露 私人 信号 ) 。 需 
要 多 少 次 干扰 ? 有 趣 的 是 ， 无 论 信息 瀑布 已 经 持续 多 久 ， 通 常 几 次 干扰 
就 足够 了 。 尽 管 有 很 多 人 参与 ， 但 每 个 人 都 知道 ， 他 们 基本 上 只 是 在 玩 
一 个 跟随 领导 者 的 游戏 ， 以 最 大 限度 地 提高 他 们 猜测 正确 的 概率 。 


皇帝 的 新 衣 效 应 (Emperor s New Clothes effect) 概括 了 信 
恩 瀑 布 的 脆弱 性 。 这 个 名 称 来 自 19 世 纪 汉 斯 : 克 里 斯 带 安安 徒 生 的 短篇 
故事 (图 9-15)〉 : 虚荣 的 星 带 得 知 ， 他 的 “新 衣 ? 是 用 最 好 的 面料 制 成 
的 ， 只 有 那些 不 称职 的 人 才 看 不 见 。 事 实 上 ， 根 本 没有 衣服 。 虽 然 每 个 
人 都 在 表演 〈 即 他 们 的 公开 动作 ) ， 但 都 不 想 显得 不 称职 《〈 即 他 们 的 私 
人 信号 ) 。 只 要 一 个 孩子 喊 道 : “ 嘿 ， 他 什么 都 没 穿 ! ”大 家 都 更 加 确 
信 ， 旺 帝 确 实在 大 庭 广 众 下 并 刁 裸 体 。 


图 9-15 
注 : 皇帝 的 新 衣 效 应 表示 ， 信 息 瀑布 可 以 很 容易 地 被 打破 


回 到 我 们 的 猜 数 字 实 验 ， 如 何 打破 信息 瀑布 ? 假设 第 一 对 参与 者 后 
出 现 1 的 信息 瀑布 。 一 段 时 间 后 ， 轮 到 弗兰克 进行 猜测 ， 他 得 到 0 作为 他 
的 私人 信和 号。 作为 公开 动作 ， 他 猜测 1， 但 他 也 喊 出 他 的 信和 号 是 0。 


现在 轮 到 格雷 戈 ， 他 也 得 到 了 私人 信号 0。 他 有 以 下 关于 私人 信和 号 
的 信息 : 
一 方面 ， 至 少 有 一 个 1， 来 自爱 丽 丝 。 但 他 不 能 确定 绝 勃 是 
否 有 一 个 1， 因 为 鲍 霓 可 能 得 到 的 是 0， 并 抛 硬币 决定 。 
。 男 一 方面 ， 至 少 有 两 个 0: 他 和 弗兰克 的 。 


那么 ， 格 雷 戈 会 怎么 做 呢 ? 他 会 猜测 0， 因 为 有 更 多 证 据 表 明 这 是 
正确 的 。 这 个 猜测 打破 了 信息 瀑布 。 请 记 住 ， 信 息 瀑布 只 表示 其 出 现时 
间 前 后 的 儿 个 人 采取 的 行动 。 如 果 大 家 部 知道 这 点 ， 为 外 几 个 人 可 能 会 
打破 它 。 


有 许多 其 他 因 系 


在 猜 数 字 实 验 中 ， 只 需要 两 个 人 就 能 引发 信息 瀑布 。 在 更 通常 的 情 
况 下 ， 要 让 一 个 人 忽视 其 本 能 ， 所 需要 的 人 和 群 大 小 取决 于 〈i) 具体 情 
境 和 《ii) 具体 个 人 。 例 如 ， 比 起 在 黑板 上 匹配 数字 ， 一 个 路 人 可 能 需 
要 看 到 更 多 人 在 街角 仰 者 头 ， 才 会 选择 从 众 。 比 起 一 个 无 聊 而 好 奇 的 
人 ， 需 要 更 多 人 在 街角 仰 着 头 ， 才 会 让 一 个 匆忙 赶路 的 过 路 人 也 这 样 
做 。 


但 也 许 我 们 在 这 里 所 做 的 最 深远 的 假设 是 ， 每 个 人 的 行为 都 是 理性 
的 。 我 们 假设 每 个 人 都 可 以 也 会 基于 他 们 的 信息 ， 决 定 什么 是 最 好 的 猜 
测 。 这 个 假设 总 是 正确 的 吗 ? 绝对 不 是 。 每 个 人 应 该 做 的 事情 和 他 在 现 
实 中 所 做 的 可 能 完全 不 同 。 研 究 人 员 已 经 观察 到 ， 猜 数字 思维 实验 并 不 
像 理论 预测 的 那样 有 效 ， 可 能 是 因为 大 多 数 人 并 没有 在 头脑 中 对 概率 进 
行 这 种 推理 。 


我 们 如 何 能 将 顺序 决策 转化 ， 以 实现 YouTube 视 频 的 病毒 式 传播 ? 
这 并 不 容易 ， 但 主要 观点 应 该 是 明确 的 : 你 希望 你 的 视频 引发 信息 瀑 
布 ， 这 样 ， 当 一 个 人 看 到 或 听 说 它 之 后 〈 即 公开 动作 ) ， 他 很 可 能 会 观 
看 它 ， 无 论 它 是 否 符合 其 内 在 利益 〈 即 其 私人 信号 ) 。 在 一 个 人 自动 观 
看 你 的 视频 之 前 ， 需 要 多 少 公开 动作 ?这 样 的 数字 是 否 存 在 ?即便 有 此 
类 数字 ， 它 对 每 个 人 来 说 部 是 不 同 的 ， 这 取决 于 人 的 顺从 程度 。 这 些 痢 
是 有 趣 的 问题 ， 还 没有 明确 的 答案 。 


第 10 章 
影响 他 人 


第 9 章 的 主要 信息 是 什么 ? 接触 公众 与 论 打 破 了 和 群众 智 意 所 需 的 独 
立 性 。 在 随后 的 请 误 中 ， 人 们 会 受到 他 人 行为 的 影响 。 

在 本 章 中 ， 我 们 将 继续 探讨 关于 影响 的 主题 ， 这 次 我 们 会 更 多 关注 
社会 网 络 背后 的 图 像 。 我 们 关于 病毒 式 传播 的 研究 对 象 是 以 人 群 为 基础 
的 场景 ， 它 假定 不 省 两 个 人 的 关系 是 什么 ， 一 方 的 公开 动作 对 男 一 方 有 
同样 的 效果 (如 图 10-1 所 示 〉。 转 向 脸 书 和 推 特等 社交 网 站 ， 我 们 的 讨 
论 将 围绕 影响 依赖 拓扑 的 方面 ， 而 不 是 以 人 口 为 基础 。 


全 一 人 一 仿 一 国 


图 10-1 第 9 章 猜 数字 思维 实验 中 的 假设 人 群 关系 
注 : A 到 B 的 连接 表示 B 从 A 获得 信息 ( 即 公开 动作 ) 


社会 影响 的 场所 


脸 书 中 的 友谊 
如 今 最 大 的 社交 网 络 应 用 是 什么 ? 脸 书 (图 10-2) 。2016 年 3 月 ， 


有 16.5 亿 人 至 少 登 录 过 脸 书 一 次 ， 这 个 数字 占 全 球 总 人 口 的 115 以 上 。 


图 10-2 脸 书 ( 左 ) 和 推 特 〈 右 ) 的 商标 标识 


2004 年 1 月 ， 马 元 : 扎 克 伯 格 为 他 的 哈佛 大 学 同学 推出 了 社交 网 
站 “Thefacebook”。 它 迅速 吸引 了 超过 一 半 的 哈佛 在 校生 ， 并 在 3 个 月 内 
扩展 到 其 他 常春 腾 盟 校 ， 逐 渐 得 到 美国 和 加 拿 大 多 数 高 校 的 关注 。2005 
年 ， 脸 书 从 其 名 字 中 删 去 “the”*， 并 辣 高 中 生 开 放 ， 不 久 后 又 同 公 司 员工 
开放 。 但 直到 2006 年 9 月 ， 该 网 站 才 开 始 人 允许 任 何 13 岁 或 以 上 的 人 ， 和 攒 
有 效 电 子 邮件 地 址 加 入 ， 这 种 注册 方式 沿用 至 今 。 


在 图 10-3 中 ， 你 可 以 看 到 2004 年 到 2015 年 ， 脸 书 每 月 活跃 用 户 数量 
迅速 增长 的 情况 。2012 年 ， 它 的 用 户 首次 突破 10 亿 大 关 ， 并 于 同年 进行 
首次 公开 募股 (CIPO) 。 
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图 10-3 自 2004 年 以 来 ， 脸 书 每 年 的 活跃 用 户 数 


到 2015 (2016) 年 ， 每 分 钟 有 超过 400 万 个 帖子 被 点 上 赞 ，3 200 万 个 
项 目 得 到 分 享 ，240 ”000 张 照片 被 上 传 到 脸 书 。 使 用 该 网 站 比例 最 大 的 
年 龄 组 为 25~34 岁 ， 占 所 有 用 户 的 30%， 在 2006 年 脸 书 出 现时 ， 他 们 正 
在 上 高 中 或 大 学 。 来 自 美国 的 用 户 比 任何 其 他 国家 都 多 ， 但 脸 书 在 国际 
舞台 上 也 占据 一 席 之 地 ， 其 约 20% 的 用 户 来 自 欧洲 ， 还 有 20% 来 自 亚 
洲 。 


脸 书 的 “好 友 ? 功 能 一 开始 就 使 它 很 受 欢 迎 。 想 想 过 去 多 年 来 ， 人 们 
通过 “添加 好 友 ? 按 钮 建立 的 所 有 联系 。 这 些 连接 以 及 它们 实现 的 互动 ， 
弥补 了 脸 书 作为 社区 媒体 和 社区 网 站 之 间 的 差距 。 


以 脸 书 用 户 为 节点 ， 我 们 可 以 通过 在 所 有 互 为 好 友 的 用 户 之 间 绘 制 
连接 ， 创 建 图 像 。 在 2015〈2016) 年 ， 大 约 有 15 亿 名 用 户 ， 平 均 每 人 有 
大 约 350 个 好 友 。 这 意味 着 图 像 有 15 亿 个 节点 ， 以 及 1.5x350 / 2s2 600 亿 
个 链接 ( 除 以 2 是 因为 我 们 不 想 将 同一 个 链接 计算 两 次 ) 。 这 是 一 个 非 
常 庞大 和 复杂 的 结构 ， 也 会 使 人 产生 疑问 ， 到 底 是 什么 构成 脸 书 上 两 个 
人 之 间 的 链接 。 友 请 当然 是 定义 链接 的 具体 方式 ， 但 也 许 某 些 更 强大 的 
概念 更 有 意义 ， 如 “好 友 ” 沟 通 的 次 数 ? 


在 推 符 上 关注 

推 特 ( 见 图 10-2〉 是 另 一 个 流行 的 社交 网 站 ， 它 赋予 用 户 使 用 微 博 
的 能 力 。 人 们 通过 它 可 以 发 送 和 接收 长 度 最 多 为 140 个 字符 的 文本 “ 推 
特 ”， 并 “关注 ”其 他 人 。 到 2016 年 一 季度 ， 约 有 13 亿 个 Twitter 账 户 被 创 
建 ， 其 中 有 3.1 亿 万 名 符合 每 月 活跃 用 户 的 标准 。 


2006 年 3 月 ， 推 特 由 杰克 :多 西 在 Odeo 网 站 首先 推出 。 同 年 7 月 ， 推 
特 网 站 成 立 ， 并 于 次 年 4 月 成 为 独立 的 公司 。 像 脸 书 一 样 ， 该 公司 自 成 
立 以 来 经 历 了 快速 成 长 ， 从 2007 年 每 季度 约 400 ”000 条 推 特 到 2008 年 每 
季度 1 亿 条 。 到 2015 年 其 诞生 9 周年 时 ， 用 户 每 天 几乎 收发 5 亿 条 推 特 。 
(差不多 每 秒 6 000 条 ! ) 


推 特 的 使 用 量 常 常 在 重大 事件 发 生 时 迅速 增加 。 在 2011 年 夏季 美国 
东海 岸 发 生地 震 后 ， 推 特 从 弗吉尼亚 到 纽约 的 传播 速度 比 地 震 还 快 。 图 
10-4 显 示 了 ， 地 震 发 生 仅 10 秒 和 80 秒 后 推 特 的 活动 情况 。 截 至 2016 年 ， 
促使 推 特 最 多 发 送 数 量 的 一 次 事件 是 2015 年 2 月 举行 的 第 49 届 美国 “超级 
碗 ”( 国 家 橄榄 球 联盟 ) 大 赛 ， 在 比赛 期 间 人 们 共 发 送 2 510 万 条 推 特 。 
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注 : 2011 年 夏季 ， 美 国 东海 岸 地 震 发 生 10 秒 《 左 ) 和 80 秒 《 右 ) 后 ， 推 特 的 活动 情 

截至 2016 年 5 月 ， 凯 带 . 佩 里 是 推 敌 上 最 受 关 注 的 人 ， 她 有 8 800 万 名 
关注 者 ， 贾 斯 汀 : 比 伯 紧 随 其 后 ， 有 8 100 万 名 关注 者 。 对 于 名 人 ， 推 特 
上 单 向 的 关注 关系 〈 即 你 可 以 关注 他 们 ， 而 他 们 不 需要 关注 你 ) 对 于 向 
粉丝 广播 其 最 新 动态 特别 有 用 。 脸 书 上 名 人 页 面 的 “喜欢 ”功能 也 是 这 
样 8 


谁 是 < 重要 的 >? 

脸 书 和 推 特 只 是 今天 存在 的 许多 在 线 社交 网 站 中 的 两 个 。 其 他 网 站 
都 是 围绕 具体 应 用 出 现 的 ， 从 Instagram 上 的 照片 和 视频 分 享 到 Yelp 的 商 
业 评 论 ， 再 到 和 聚 课 的 社会 化 学 习 〈 在 第 8 章 讨 论 过 ) 。 


关于 人 们 如 何在 这 些 网 络 中 表现 和 互动 ， 已 经 有 过 许多 研究 。 人 们 
试图 回答 以 下 两 个 重要 问题 : 


1， 我 们 如 何 衡量 个 人 的 影响 力 ? 


2， 我 们 如 何 利 用 有 关 哪 些 人 具有 影响 力 的 知识 ， 对 在 线 用 户 产 
生 实 际 影响 ? 


这 些 都 不 容易 回答 。 理 论 和 实践 之 间 存 在 着 巨 大 的 差距 ， 这 也 是 在 
本 书 中 能 够 看 到 的 最 大 的 问题 。 但 这 并 没有 阻止 人 们 寻找 答案 。 


例如 ， 关 于 第 一 个 问题 ， 一 些 公司 就 在 记录 一 些 人 在 推 特 上 的 个 人 
影响 力 。 它 们 如 何 量化 一 个 人 的 影响 力 ? 有 几 种 可 能 的 做 法 ， 例 如 ， 访 
人 拥有 的 关注 者 数量 、 转 发 数量 或 转 帖 数量 。 一 些 公司 也 试图 将 脸 书 的 
整个 社交 图 组 合 起 来 ， 这 将 使 它们 了 解 网 络 中 哪些 人 是 最 重要 的 。 我 们 
将 在 本 章 中 了 解 定义 重要 性 的 方法 。 


至 于 第 二 个 问题 ， 例 如 营销 公司 如 何 利 用 关于 影响 力 的 知识 来 销售 
产品 ? 它们 将 设法 把 产品 放 到 那些 被 认为 具有 最 高 社会 影响 力 的 人 们 手 
中 。 它 们 可 能 会 或 励 一 些 有 影响 力 的 个 人 或 大 量 随机 选择 但 相对 有 影响 
力 的 人 ， 和 希望 别人 看 到 这 些 人 手中 的 产品 后 ， 会 决定 购买 该 产品 。 在 本 
章 后 面 的 部 分 ， 我 们 将 看 到 ， 找 到 宣传 产品 的 最 佳人 选 是 多 么 困难 和 违 
反 和 直觉 的 。 


除了 营销 活动 之 外 ， 关 于 识别 和 利用 有 影响 力 的 个 人 ， 我 们 可 以 写 
- 整 本 书 。 一 个 有 趣 的 历史 故事 发 生 在 1775 年 美国 革命 的 前 夜 ， 保 罗 : 
里 维尔 和 威廉 : 道 斯 进行 了 所 谓 的 午夜 儿 风 。 在 4 月 18 日 晚上 ， 他 们 从 激 
士 顿 和 坎 布 里 奇 附近 出 发 去 提醒 美国 人 ， 瑞 国人 计划 在 列 殉 星 敦 和 康 科 
德 发 起 攻击 。 他 们 各 自 沿 着 不 同 的 路 径 去 列 克星 敦 ， 在 那里 会 合 之 后 ， 
又 共 同 前 往 康 科 德 。 在 前 往 列 克 星 敦 的 路 上 ， 里 维尔 成 功 提醒 了 极 具 影 
啊 力 的 民兵 组 织 领导 人 ， 并 最 终 比 道 斯 更 有 效 地 传播 了 消息 。 这 在 第 二 
天 帮助 美国 人 赢得 了 这 场 战 争 的 第 一 次 战斗 。 


社会 重要 性 的 常见 定义 


我 们 如 何 衡 量 一 个 人 在 社交 网 络 中 的 重要 性 ?从 网 络 的 社交 图 开 
始 ， 每 个 节点 都 是 一 个 人 ， 如 图 10-5 所 示 。 社 交 图 中 的 链接 可 以 象征 什 
么 ? 这 有 很 多 可 能 性 ， 正 如 我 们 在 第 8 半 社 会 化 学 习 网 络 中 看 到 的 ， 它 
们 可 能 是 有 向 或 无 辐 ， 加 权 或 不 加 权 ， 这 一 切 都 取决 于 我 们 想 要 图 像 表 
示 什 么 。 


在 图 10-5 中 ， 链 接 是 无 同 的 “没有 箭头 ) 。 假 设 这 里 的 链接 表示 两 
个 链接 的 市 上 “认识 ”对 方 ( 例 如 ， 达 娜 认识 卡拉 、 埃 文 和 弗 兰 殉 ， 而 本 
只 认识 安娜 ) 。 脸 书 的 朋友 图 也 是 无 回 的 ， 因 为 如 果 你 是 我 的 朋友 ， 那 
么 我 一 定 也 是 你 的 朋友 。 我 们 在 第 8 章 看 到 的 学 生 之 间 的 共同 参与 图 也 
是 如 此 。 与 此 相反 ， 推 符 的 关注 图 是 有 问 的 : 即使 你 关注 了 最 喜欢 的 首 
乐 家 ， 可 能 对 方 并 没有 关注 你 。 第 5 章 中 的 网 络 图 也 一 样 。 


ju 


图 10-5 我 们 用 于 计算 中 心性 的 无 向 社交 图 示例 
有 了 图 示 后 ， 我 们 如 何 衡量 每 个 节点 的 重要 性 ? 事实 上， 人们 已经 


提出 了 许多 不 同 的 指标 。 在 这 里 ， 我 们 将 了 解 节 点 中 心性 的 三 个 第 见 测 
量 标准 。 


简易 方法 : 程度 中 心性 


最 显而易见 的 标准 是 程度 中 心性 (degree centrality) ， 也 就 是 
连接 到 相关 节点 的 节点 数量 。 在 第 5 章 ， 我 们 计算 了 有 向 网 络 图 的 入 度 
和 出 度 。 对 于 无 向 图 ， 两 者 没有 区 别 ， 所 以 问题 更 简单 。 


图 10-5 中 的 度数 是 多 少 ? 安娜 的 度数 是 2: 她 是 本 和 卡拉 的 朋友 。 
本 的 度数 是 1: 他 只 是 安娜 的 朋友 。 卡 拉 、 达 娜 、 埃 文 和 弗兰克 的 度数 
分 别 为 3、3、3 和 2。 根 据 这 一 标准 ， 我 们 将 卡拉 、 达 娜 和 埃 文 并 列 作 为 
最 重要 的 证 把， 其 次 是 安娜 和 弗 兰 殉 并 列 作为 第 二 重要 的 季 操 ， 最 后 古 
本 ， 作 为 最 不 重要 的 节点 。 


这 个 排名 合理 吗 ? 我 们 同意 本 应 该 是 最 不 重要 的 ; 他 唯一 的 联系 是 
安娜 。 我 们 也 可 以 认为 ， 达 娜 和 埃 文 的 重要 性 应 该 相同 ， 因 为 他 们 连接 
到 相同 的 人 。 


可 是 卡拉 呢 ? 她 提供 了 安娜 和 本 与 图 像 其 余部 分 唯一 的 连接 。 没 有 
她 ， 网 络 将 分 割 (partition) 成 两 组 ， 如 图 10-6 所 示 。 此 外 ， 没 有 安 
娜 ， 本 将 不 会 连接 到 图 像 。 如 果 我 们 在 讨论 中 心性 ， 那 么 ， 既 然 安 娜 和 
卡拉 对 图 像 的 连通 性 更 重要 ， 我 们 不 应 该 给 她 们 更 多 分 数 吗 ? 


图 10-6 
注 : 如 果 我 们 删除 卡拉 ， 那 么 安娜 和 本 将 不 再 连接 到 其 他 节点 。 这 应 该 能 多 少 证 明 
卡拉 的 中 心性 

程度 中 心性 没有 考虑 到 的 另 一 点 ， 是 我 们 在 第 5 章 网 页 排序 中 看 到 
的 : 如 果 一 个 节点 连接 到 许多 重要 节点 ， 它 应 该 比 连接 到 许多 不 重要 的 
节点 更 为 重要 。 网 页 级 别 算法 (第 5 章 ) 通过 将 每 个 节点 的 重要 性 传播 
到 其 近邻， 解决 了 这 些 问题 。 我 们 也 可 以 在 这 里 应 用 这 个 方法 吗 ? 确实 
可 以 ， 而 且 这 是 个 你 可 以 自己 做 得 不 错 的 练习 。 我 们 则 将 探索 在 社交 图 
中 定义 中 心性 的 其 他 方法 。 


统计 路 径 : 接近 中 心性 


我 们 的 第 二 个 重要 性 标准 一 一 接近 中 心性 (closeness 
centrality) ， 着 眼 于 节点 到 其 近邻 的 距离 。 要 找到 这 一 距离 ， 我 们 必 
须 考虑 图 中 两 个 节点 之 间 的 距离 ， 这 是 包含 它们 的 最 短路 径 (shortest 
path) 中 的 链接 数 。 一 条 路 径 (path) 是 连接 节点 的 一 系列 链接 ， 最 


短路 径 则 是 利用 尽 可 能 少 的 连接 的 路 径 。 我 们 通常 用 从 头 到 尾 通 过 路 径 
时 访问 的 节点 ， 来 表示 一 条 路 径 。 所 以 在 图 10-5 中 ， 从 本 到 弗兰克 的 路 
径 经 过 安娜 、 卡 拉 、 埃 文 ， 然 后 是 达 娜 ， 表 示 为 (B，A，C，E，D， 
F) 。 这 条 路 径 的 长 度 是 5， 因 为 它 有 5 个 链接 (我 们 将 在 第 12 章 和 第 14 
章 探 索 最 短路 径 算 法 ) 。 


除了 这 条 路 径 ， 还 有 其 他 从 本 到 弗兰克 的 途径 。 例 如 ， 我 们 可 以 在 
埃 文 之 前 访问 达 娜 (B，A，C，D，E，F) 。 我 们 也 可 以 使 用 更 少 的 链 
接 ， 因 为 没有 必要 同时 使 用 达 娜 和 埃 文 : (B，A，C，D，F) 和 (了 B， 
A，C，E，EF) 分 别 只 有 4 个 链接 。 这 些 是 本 和 弗兰克 之 间 的 最 短路 径 ， 
其 中 之 一 在 图 10-7 中 高 亮 显 示 。 


(A, OC) 


图 10-7 
注 : 本 和 弗兰克 之 间 最 短 的 路 径 之 一 是 (B，A，0C，D，F) ， 长 度 为 4 


节点 的 接近 中 心性 是 基于 距离 其 他 每 个 市 点 最 短路 径 长 度 的 平均 
值 。 接 近 中 心性 较 小 的 节点 往往 更 接近 其 他 节点 ， 而 且 根 据 这 个 度量 标 
准 更 为 重要 。 


让 我 们 为 卡拉 计算 接近 中 心性 。 首 先 ， 在 图 10-5 中 ， 我 们 需要 找到 
她 和 其 他 市 点 之 间 的 最 短路 径 : 


从 卡拉 到 本 的 最 短路 径 是 什么 ? 只 有 一 条 路 径 《C，A， 
B) ， 长 度 为 2。 


到 安娜 的 路 径 呢 ? 最 短路 径 包 括 一 个 链接 (C0C，A) ， 长 度 为 


。 到达 娜 的 呢 ? 最 短路 径 是 链接 (C，D) ， 长 度 为 1。 
。 到 埃 文 的 呢 ? 链接 (6C，E) ， 长 度 为 1。 


到 弗兰克 的 呢 ? 最 短路 径 是 (0，D，F) 和 (0，E，F) ， 长 
度 为 2。 


你 可 以 在 图 10-8 中 看 到 这 些 距离 的 概要 。 平 均值 是 多 少 ? 我 们 通过 
将 这 些 距 离 相 加 ， 再 除 以 总 数 〈5) ， 得 出 平均 值 : 
让 


图 10-8 卡拉 5 的 最 短路 径 链 5 接 和 长 度 


答案 即将 揭晓 ， 除 了 一 个 小 细节 。 我 们 想 要 一 个 较 小 的 平均 值 〈 而 
不 是 更 大 ) ， 以 表示 更 高 的 中 心性 ， 表 明 该 人 距离 更 近 。 所 以 我 们 采用 


倒数 : 


l 5 
75 7- 0.714 


你 可 以 采取 同一 步骤 ， 得 出 图 中 其 他 人 的 接近 中 心性 。 如 果 你 对 达 
娜 中 心性 的 具体 说 明 感 兴趣 ， 请 参考 本 书 网 站 Q10.1 部 分 。 以 下 是 计算 
步骤 和 结 采 的 摘要 : 


安娜 : -0.556 
本 : i 
达 娜 : T0625 
埃 文 : 二 625 

0.455 


按照 接近 中 心性 来 看 ， 卡 拉 最 高 ， 其 次 是 达 娜 和 埃 文 (平分 ) ， 然 
后 是 安娜 ， 之 后 是 弗 兰 苑 ， 最 后 是 本 。 相 比 程度 中 心性 ， 很 多 平分 都 被 
打破 : 卡拉 第 一 ， 安 娜 现在 比 弗 兰 殉 高。 卡拉 和 安娜 对 图 像 连 通 性 至 关 
重要 ， 这 说 明了 提高 她 们 分 数 的 合理 性 。 


接近 中 心性 非常 和 直观: 接近 你 的 人 越 多 ， 你 对 网 络 的 中 心性 越 高 。 
这 是 我 们 能 取得 的 最 好 结果 吗 ? 有 人 会 说 ， 我 们 例子 中 的 排名 仍然 有 一 
些 了 矛盾 之 处 。 第 一 ， 为 什么 安娜 不 如 达 娜 和 埃 文章 要 呢 ?” 达 娜 和 埃 文 真 
的 不 像 安 娜 那样 ， 对 图 像 连通 性 如 此 重要 《〈 见 图 10-9) 。 其 次 ， 为 什么 
卡拉 的 接近 中 心性 只 比 达 娜 和 埃 文 的 稍 高 ? 她 对 图 像 连通 性 要 重要 得 
多 。 


图 10-9 
注 : 我 们 可 以 删除 达 娜 或 埃 文 ， 同 时 不 让 其 余 节 点 断 开 


另 一 个 中 心性 的 概念 同样 有 用 ， 也 许 能 比 接近 中 心性 更 加 符合 这 种 


直觉 。 
衡量 连通 性 : 中 介 中 心性 


假设 安娜 需要 通过 网 络 中 的 最 短路 径 ， 向 弗兰克 传递 消息 。 参 考 图 
10-10， 她 可 以 采取 两 条 路 线 : 


图 10-10 


注 : 如 果 安 娜 想 发 送 一 条 消息 给 弗兰克 ， 她 必须 把 它 发 给 卡拉 ， 而 卡拉 可 以 将 它 转 
给 达 娜 或 埃 文 

。 告诉 卡拉 ， 卡 拉 告 诉 达 娜 ， 达 娜 告诉 弗兰克 ; 

。 告诉 卡拉 ， 卡 拉 告 诉 埃 文 ， 埃 文告 诉 弗兰克 。 


无 论 哪 种 情况 ， 她 都 需要 告诉 卡拉 。 但 卡拉 有 两 种 可 能 的 选择 : 她 
可 以 选择 告诉 达 娜 或 埃 文 。 对 于 安娜 友 送 给 弗兰克 的 消 奶 ， 如 果 我 们 要 
分 配 重要 性 分 数 ， 应 该 怎么 做 ? 卡拉 可 能 得 到 最 高 分 数 ， 因 为 这 两 条 路 
径 都 涉及 她 。 两 条 路 径 中 ， 只 有 一 条 涉及 达 娜 或 埃 文 ， 所 以 他 们 可 以 各 
得 卡拉 的 一 半分 数 。 


另 一 个 例子 是 ， 如 果 本 想 给 达 娜 发 消息 怎么 办 ? 这 里 只 有 一 条 最 短 
路 径 : 发 给 安娜 ， 安 娜 转发 给 卡拉 ， 卡 拉 转 给 达 娜 。 分 配 分 数 时 ， 安 娜 


和 卡拉 可 能 得 到 相同 的 分 数 。 相 对 第 一 个 例子 中 给 卡拉 、 达 娜 和 埃 文 的 
分 数 ， 他 们 应 该 得 到 多 少 ? 以 前 有 两 条 路 径 都 是 可 能 的 ， 但 现在 只 有 一 
条 ， 这 使 得 它 更 加 关键 。 没 有 安娜 或 卡拉 ， 本 无 法 给 达 娜 发 送 消 轧 ， 同 
样 ， 没 有 卡拉 ， 安 娜 无 法 给 弗 兰 克 发 送 消息 。 因 此 ， 安 娜 和 卡拉 为 这 一 
条 路 径 得 到 的 分 数 ， 可 能 和 之 前 卡拉 为 两 条 路 径 得 到 的 同样 多 。 


基于 此 ， 当 一 个 节点 位 于 网 络 中 其 他 节点 之 间 的 多 条 关键 路 径 中 
时 ， 中 介 中 心性 (betweenness centrality) 认为 其 更 加 重要 。 从 A 
到 也 的 最 短路 径 越 多 ， 每 条 路 径 对 于 另 一 个 节点 的 中 心性 束 越 低 ， 因 为 
每 条 路 径 对 于 这 对 节点 都 不 太 重 要 。 如 果 从 A 到 B 有 3 条 最 短路 径 ， 其 中 
两 条 包含 C， 那 么 C 能 从 这 对 节点 得 到 多 少 分 数 ? 2/3。 在 我 们 的 例子 
中 ， 对 于 安娜 和 弗兰克 这 对 节点 来 说 ， 我 们 要 给 卡拉 2/2 〈 她 位 于 两 条 
路 径 中 ) ， 达 娜 和 埃 文 各 得 1 / 2〈 他 们 位 于 其 中 一 条 路 径 中 ) 。 对 于 本 
和 达 娜 这 对 节点 ， 安 娜 和 卡拉 将 分 别 获得 1 / 1〈 他 们 都 位 于 唯一 的 路 径 
中 ) 。 


让 我 们 计算 卡拉 的 中 介 中 心性 。 在 开始 之 前 ， 我 们 移 凭 直 沉 来 判断 
一 下 ， 相 对 于 其 他 人 ， 她 的 中 心性 将 是 高 还 是 低 ? 估计 是 高 : 因为 她 把 
图 像 的 两 边 结 合 在 一 起 。 你 可 能 在 自己 的 社交 网 络 中 就 认识 这 样 的 人 ! 


要 找到 卡拉 的 中 心性 ， 除 了 那些 与 卡拉 有 关 的 节点 ， 我 们 还 需要 考 
虑 图 像 中 的 每 对 市 点 。 在 这 样 做 时 ， 我 们 思考 两 个 问题 ， 这 对 市 点 之 间 
有 多 少 条 最 短路 径 ? 这 些 最 短路 径 中 有 多 少 包 含 卡 拉 ? 


安娜 和 本 : 有 多 少 条 最 短路 径 ? 只 有 一 条 ， 链 接 (A，B) 。 
其 中 包含 卡拉 吗 ? 不 ， 所 以 她 得 到 0 / 1 = 0 分 。 

安娜 和 达 娜 : 有 多 少 条 最 短路 径 ? 一 条 (A，C，D) 。 其 中 
包含 卡拉 吗 ? 是 ， 她 得 到 1 / 1 = 1 分 。 

安娜 和 埃 文 : 还 是 有 一 条 最 短路 径 (A，0，E) 。 因 为 它 包 
含 卡拉 ， 她 再 次 得 到 1 / 1 = 1 分 。 


安娜 和 弗兰克 : 有 多 少 条 最 短路 径 ? 两 条 (A，C，D，F) 和 
(A，C，E，F) 。 有 多 少 条 包含 卡拉 ? 两 条 都 包含 ， 所 以 她 得 到 2 / 
么 后 .| 

本 和 达 娜 : 有 一 条 最 短路 径 (B，A，C，D) 。 它 包含 卡拉 
ee A 

本 和 埃 文 : 还 是 只 有 一 条 最 短路 径 (B，A，C，E) ， 并 且 包 
含 卡 拉 ， 所 以 她 得 到 1 / 1 = 1 分 。 

本 和 弗兰克 : 有 多 少 条 路 径 ? 两 条 (B，A，C，D， ee 

(B，A，C，E，F) 。 因 为 两 条 都 包含 卡拉 ， 所 以 她 得 到 2 / 2 = 


分 。 


达 娜 和 埃 文 ， 达 娜 和 弗兰克 ， 埃 文 和 弗兰克 : 其 中 每 对 节点 
有 一 条 最 短路 径 (D，E) ， (D，F) 和 (E，F) 。 它 们 都 不 包含 卡 
拉 ， 所 以 她 为 每 条 路 径 得 到 0 / 1 =0 分 。 


这 些 数 字 相 加 ， 得 到 卡拉 的 中 介 中 心性 : 
0+1+1+1+1+1+1+0+0+0=6 


你 可 以 为 其 他 节点 采取 同样 的 计算 过 程 。 如 果 你 对 达 娜 的 情况 感 兴 
趣 ， 请 参考 本 书 网 站 Q10.2 部 分 。 经 过 计算 ， 安 娜 的 中 介 中 心性 是 4《〈 仅 
次 于 卡拉 ) ， 埃 文 和 上 弗兰克 的 是 1.5( 并 列 第 三 ) ， 弗 兰 元 和 本 的 是 
0《〈 并 列 第 四 ， 他 们 不 在 任何 最 短路 径 上 ) 。 0 
重要 的 节点 : 她 的 中 介 中 心性 比 安娜 高 1.5 倍 ， 比 达 娜 和 埃 文 高 4 倍 。 

外 ， 安娜 现在 比 运 娜 和 闭 文 更 重要 | 不 像 其 他 方法 ， 中 介 | 
安娜 对 网 像 连通 性 的 贡献 。 


在 表 10-1 中 ， 你 可 以 看 到 我 们 在 这 个 例子 中 运用 的 不 同 中 心性 标准 
概要 : 程度 、 接 近 和 中 介 。 我 们 也 可 以 加 入 网 页 级 别 的 重要 性 评分 。 采 
用 哪 一 个 标准 取 雇 于 使 用 中 心性 标准 的 目标 。 基 本 论点 是 程度 中 心性 相 


当 简 单 ， 而 接近 和 中 介 中 心性 产生 的 排名 更 符合 我 们 的 直觉 ， 而 且 更 能 
体现 那个 被 认为 很 重要 的 人 的 潜在 用 处 。 


表 10--1 

程度 接近 中 介 
数值 排名 数值 排名 数值 排名 
安娜 2 第 二 0.39 第 五 4 第 二 
本 1 第 三 0.56 第 三 0 第 四 
卡拉 3 第 一 0.71 第 一 6 第 一 
达 娜 3 第 一 0.63 第 二 1.5 第 三 
埃 文 3 第 一 0.63 第 三 1.5 第 三 
弗兰克 2 第 二 0.46 第 四 0 第 四 


通过 传播 产生 社会 影响 


让 我 们 记 住 中 心性 的 概念 ， 然 后 继续 第 9 章 对 影响 模型 的 讨论 ， 这 
次 会 考虑 到 社交 图 像 。 我 们 将 看 到 ， 一 个 人 的 社会 关系 如 何 影响 他 采用 
某 个 产品 或 项 目 。 


考虑 图 10-11 中 的 网 络 ， 其 中 有 8 个 节点 连接 到 中 间 的 节点 。 关 于 其 
是 否 已 经 采用 茶 个 产品 、 服 务 或 项 目 ， 每 对 相 邻 节点 有 两 种 状 
态 :“Y"” 表 示 是 ,“N "表示 人 否 。 处 于 “Y” 状 态 的 4 个 市 点 是 否 会 产生 足够 
的 社会 影响 ， 以 致 中 心 节 点 翻转 〈 即 采用 该 项 目 ) 呢 ? 


图 10-11 
注 : 中 心 节点 的 4 个 链接 已 切换 〈《“Y”) ， 另 外 4 个 没有 《〈“N”) 


要 理 清 头绪 ， 可 以 假设 你 是 位 于 中 心 的 那个 人 ， 相 邻 节 点 是 你 的 杀 
密 朋友 ， 有 些 人 最 近 购 买 了 最 新 的 苹果 手机 (“Y”) ， 其 他 人 没有 
(“N”) 。 可 以 想象 ， 你 看 到 拥有 它 的 人 越 多 (假设 他 们 满意 ) ， 这 对 
你 的 影响 就 越 大 ， 你 惑 越 可 能 也 想 买 一 个 。 有 没有 办 法 让 我 们 知道 ， 你 
最 后 到 展会 不 会 跟风 ? 


一 个 典型 的 模式 是 为 每 个 节点 设置 一 个 翻转 阅 值 (flipping 
threshold) 。 这 是 某 个 节点 翻转 之 前 ， 其 近邻 需要 翻转 的 比例 。 在 图 
10-11 中 ， 中 心 节点 50% (4/8) 的 近邻 已 经 翻转 。 所 以 ， 如 果 他 的 羡 值 
低 于 50%， 他 也 会 得 到 这 个 项 目 ， 但 如 果 阔 值 更 高 ， 那 么 他 就 不 会 ， 因 
为 这 个 项 目 没有 足够 的 社会 影响 力 。 例 如 ， 如 果 他 的 闵 值 是 80%， 他 将 
需要 至 少 7 个 朋友 已 经 获得 该 项 目 〈 因 为 7/8>0.8， 但 6/ 8 不是) 。 


实际 上 ， 翻 转 阔 值 很 难 估 计 。 这 取决 于 很 多 不 同 的 因素 ， 就 像 第 9 
章 引 发 信息 课 布 需要 一 定 的 人 和 群 规模 那样 。 其 中 一 个 因 系 是 项 目 本 身 : 


例如 ， 更 便宜 和 更 具 吸 引力 的 产品 往往 会 降低 装 值 。 另 一 个 因素 是 个 
人 : 鲍 动 可 能 相对 容易 动摇 ， 只 要 一 两 个 朋友 这 样 做 ， 他 就 会 跟风 ， 而 
爱丽 丝 可 能 永远 不 会 动摇 。 还 有 几 个 网 络 因素 ， 如 人 与 人 之 间 的 社会 关 
系 的 力量 ， 以 及 链接 代表 的 含义 。 对 于 我 们 的 目的 而 言 ， 我 们 假设 知道 
翻转 阐 值 ， 并 且 它 对 于 图 中 每 个 节点 都 是 相同 的 。 


让 我 们 考虑 图 10-12 中 包含 8 个 人 的 社交 图 。 查 理 已 经 翻转 ， 而 其 他 
人 都 没有 。 假 设 闵 值 为 50%， 图 像 将 如 何 随 时 间 变 化 ?这 个 过 程 被 称 为 
传染 (contagion) ， 在 男 一 个 理想 化 的 模型 中 它 将 这 样 展 开 。 


安娜 查理 贫 天 乔治 
本 达 娜 弗兰克 汉 娜 


图 10-12 包含 8 个 节点 的 社交 图 ， 用 于 说 明 传 播 问 题 


注 : 你 可 以 将 其 看 成 一 群 人 购买 某 个 产品 。 最 初 ， 查 理 拥 有 该 产品 ， 并 实现 “ 翻 
转 ”， 而 其 他 人 没有 


往生- 
党 一 步 


在 每 一 个 时 间 点 ， 我 们 对 所 有 人 逐个 检查 ， 看 他 们 的 翻转 闪 值 是 否 
达到 ， 如 果 是 ， 我 们 切换 到 “Y”。 


安娜 : 最初 ， 她 的 一 个 近 令 出现 翻转 (查理 ) ， 而 另 一 个 没 
有 ( 达 娜 ) 。 她 会 翻转 吗 ? 既然 正好 有 50%， 这 就 证 明 安 娜 获得 了 足 


够 的 社会 影响 ， 所 以 她 会 翻转 。 


。 本 : 他 的 近邻 中 有 多 少 人 翻转 了 ? 一 个 〈 查 理 ) ， 而 另 一 个 
没有 【〔 达 娜 ) : 50% 足 够 了 ， 所 以 他 会 翻转 。 


。 达 娜 : 达 娜 怎么 样 ? 这 有 点 儿 粹 手 ， 因 为 我 们 刚刚 确定 ， 她 
的 两 个 近邻 将 翻转 。 但 是 ， 这 直到 这 一 轮 才 会 发 生 : 此 时 ， 她 的 近 
邻 都 没有 翻转 。 由 于 影响 为 0%， 她 也 不 会 翻转 。 


。 ”伊美 : 她 的 一 个 近邻 翻转 了 (查理 ) ， 而 另外 4 个 没有 。 她 
受到 多 少 影响 ? 1 / 5， 或 20%。 由 于 这 低 于 50%， 因 此 不 足以 导致 翻 
转 。 


。 上 弗兰克、 乔治 和 汉 娜 ; 他 们 的 近邻 都 没有 翻转 。 


生成 的 图 如 图 10-13 所 示 。 
安娜 查理 伊美 乔治 
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图 10-13 第 一 步 后 的 传播 


所 A 


第 二 步 


现在 情况 如 何 ? 下 一 步 使 用 更 新 后 的 图 像 〈 图 10-13) : 


。 达 娜 : 她 的 两 个 近邻 〈 安 娜 和 本 ) 已 经 翻转 ， 另 外 两 个 没有 
(伊美 和 上 弗兰克 ) : 50% 的 影响 足够 她 实现 翻转 。 


， 伊 关 、 上 弗兰克 、 认 治 和 汉 娜 ; 情况 没有 改变 。 


在 图 10-14 中 ， 你 可 以 看 到 第 二 次 迭代 结束 时 ， 每 个 节点 的 状态 。 
网 络 的 左 半边 已 经 翻转 ， 而 右 半 边 没 有 。 我 们 是 否 有 机 会 让 每 个 人 都 最 
终 翻 转 ? 让 我 们 看 看 。 


安娜 查理 伊 天 乔治 


Df 
I 


图 10-14 第 二 步 后 的 传播 


第 三 步 
现在 情况 如 何 ? 


。 伊美 : 她 的 两 个 近邻 已 经 翻转 ， 其 他 3 个 还 没有 ， 影 响 为 
40%。 不 足以 实现 翻转 。 

。 上 弗兰克 : 他 的 一 个 近邻 已 经 翻转 ， 另 外 3 个 还 没有 。 有 影响 为 
25%。 有 影响 还 是 不 够 。 


。 乔治 和 汉 娜 : 他 们 的 近邻 仍然 都 没有 翻转 。 


因此 ， 没 有 节操 在 第 三 步 改变 状态 。 为 什么 会 这 样 ? 因为 每 一 个 节 
点 都 有 太 多 没有 翻转 的 近邻 ， 却 没有 足够 已 经 翻转 的 近邻 。 在 伊 关 、 弗 
兰 殉 、 乔 治 和 汉 娜 中 ， 伊 美 连接 至 “Y” 状 态 的 比例 最 高 ， 而 她 能 得 到 的 
影响 仅 为 40%。 换 句 话说 ， 这 4 个 节点 形成 了 一 个 不 能 从 外 部 渗透 的 社 
会 集群 (cluster) ( 见 图 10-15) 。 


伊 夫 乔治 


弗 兰 珊 汉 娜 
图 10-15 

注 : 人 伊美、 弗兰克 、 乔 治 和 汉 娜 的 集群 过 于 密集 ， 外 部 社会 力量 无 法 渗透 。 伊 关 有 
60% 的 连接 在 集群 内 ， 弗 兰 克 有 75%， 乔 治 和 汉 娜 为 100% 

更 一 般 地 说 ， 任 何 彼此 之 间 有 连接 的 节点 群 都 可 以 称 为 集群 。 以 一 
个 集群 的 未 翻转 节点 为 例 ， 如 果 其 中 每 个 节点 内 部 都 有 太 多 近邻 ， 就 不 
可 能 对 其 产生 影响 。 如 果 你 有 兴趣 了 解 如 何 确定 集群 的 密度 
(density) ， 请 参考 本 书 网 站 Q10.3 部 分 。 


战略 营销 : 最 大 限度 地 扩大 集体 影响 力 


你 能 看 到 传播 和 战略 营销 之 间 的 联系 吗 ? 其 目的 是 ， 通 过 一 开始 选 
择 合适 的 人 来 宣传 产品 ， 最 大 限度 地 增加 会 购买 我 们 产品 的 人 数 。 在 图 
10-14 中 ， 我 们 已 经 接触 到 一 半 的 人 。 


我 们 可 以 采取 什么 措施 来 让 更 多 人 翻转 ?如 果 我 们 了 解 社交 图 并 信 
任 传播 模型 ， 会 有 一 些 可 能 性 。 一 个 是 尝试 降低 翻转 阐 值 ， 如 果 阐 值 下 
降 ， 即 使 只 是 减少 几 个 节点 ， 我 们 也 会 有 更 好 的 机 会 在 系 个 时 间 影 响 所 
有 人 。 男 一 种 选择 是 尝试 打破 集群 。 如 果 我 们 以 某 种 方式 从 内 部 切断 社 
会 天 系 ， 我 们 可 以 更 容易 地 从 外 部 渗透 它们 。 或 者 可 以 尝试 在 集群 内 发 
展 节 点 ， 从 内 部 产生 社会 影 啊 。 


这 些 选择 中 哪些 是 可 行 的 ? 调整 准 值 会 要 求 我 们 改变 人 们 的 喜好 ， 
而 打破 联系 则 要 求 改变 社会 关系。 这 些 都 是 营销 公司 可 能 无 法 控制 的 因 
素 。 忆 一 种 方法 是 ， 看 我 们 是 否 可 以 加 集群 内 的 节点 文 付 报酬 ， 使 其 采 
用 该 产品 。 回 到 图 10-14， 例 如 ， 选 择 发 展 伊 天 、 弄 治 、 弗 兰 死 或 者 汉 
娜 中 的 任何 一 人 ， 都 可 以 达到 这 一 目的 。 


更 一 般 地 说 ， 假 设 每 个 人 都 能 受到 一 定数 额 金钱 的 影响 。 据 推测 ， 
那些 更 有 影响 力 的 节点 将 需要 伦 更 多 的 钱 。《〈 例 如 ， 一 家 设计 公司 可 能 
会 付 给 一 个 名 人 一 大 笔 钱 ， 让 他 穿 上 其 品牌 的 衣服 。) 在 总 预算 的 约束 
下 ， 我 们 应 该 发 展 哪个 节操 以 实现 平衡 状态 下 最 大 程度 的 翻转 ， 同 时 最 
大 限度 地 减少 达到 这 种 平衡 所 再 的 时 间 ? 


这 又 是 一 个 很 难 回答 的 问题 。 如 有 果 我 们 能 像 第 9 章 的 顺序 决策 那 
样 ， 找 到 一 种 方法 来 触发 正 反 馈 ， 结 果 会 很 棒 : 我 们 及 展 的 市 皮 将 影响 
其 他 市 点 实现 翻转 ， 产 生 足 够 的 影响 ， 使 更 多 节点 发 生 翻转 ， 产 生 更 大 
的 影响 ， 以 此 类 推 。 如 果 我 们 只 能 发 展 一 个 节点 ， 也 许 应 该 根据 和 个 中 
心性 标准 ， 选 择 最 重要 的 一 个 市 皮 ? 这 并 不 总 是 一 个 稳 受 的 做 法 。 当 我 
们 可 以 肥 展 多 个 市 点 时 ， 情 况 会 变 得 更 加 复杂 。 一 般 来 说 ， 我 们 不 想 选 
择 最 中 心 的 节点 。 我 们 的 目标 是 ， 选 择 那 些 “ 组 合影 啊 力 最 大 的 节点 。 


以 我 们 在 图 10-5 中 最 初 包含 6 个 市 后 的 社交 图 为 例 。 根 据 接近 和 中 
介 中 心性 来 看 ， 卡 拉 都 是 最 重要 的 。 如 果 我 们 最 初 选择 发 展 卡 拉 ， 结 果 
会 怎样 ? 经 过 两 个 时 间 步 ， 我 们 将 使 三 个 市 点 翻 转 ， 安娜 、 本 和 卡拉 。 
但 我 们 能 做 得 更 好 吗 ? 是 的 : 有 趣 的 是 ， 无 论 是 发 展 达 娜 还 是 埃 文 ， 都 
将 导致 所 有 市 点 在 5 个 步 又 后 翻转 ! 这 些 中 心性 标准 并 不 总 是 符合 最 大 
化 影响 ， 这 使 得 对 于 发 展 节 点 的 选择 ， 很 难 找到 一 个 有 效 的 解决 方案 。 


如 采 我 们 可 以 选择 发 展 两 个 节点 呢 ? 也 许 我 们 会 想 ， 那 束 根 据 中 介 
中 心性 选择 最 重要 的 两 个 节点 : 卡拉 和 安娜 。 这 样 会 发 生 什么 ?其 实 并 
不 会 和 只 发 展 卡拉 的 结果 相差 太 大 。 那 么 ， 是 否 存在 一 组 两 个 节点 ， 会 
导致 整个 网 络 的 翻转 速度 比 只 发 展 达 娜 和 埃 文 更 快 ? 是 的 ， 试 想 当 我 们 
发 展 安 娜 和 达 娜 时 的 情况 ， 如 图 10-16 所 示 : 


安娜 达 娜 安娜 达 娜 


本 埃 文 
图 10-16 
注 : 如 果 我 们 发 展 安娜 和 达 娜 ， 整 个 网 络 将 在 这 两 步 后 翻转 


。 一 步 以 后 ， 我 们 能 让 所 有 人 翻转 ， 除 了 埃 文 。 
。 两 步 以 后 ， 埃 文 也 翻转 ， 所 以 我 们 达到 了 目标 。 


同样 ， 基 于 中 心性 的 选择 并 不 总 是 最 好 的 策略 。 重 要 的 是 ， 要 确保 
我 们 选择 的 市 点 拥有 最 大 的 集体 影响 并 不 是 一 件 容 易 的 事 ， 特 别 是 在 可 
能 包含 数 十 亿 节 点 的 真实 在 线 社 交 网 络 中 。 


第 四 部 分 
当 疆 


/AN 二 口 


在 本 书 的 这 一 部 分 ， 我 们 研究 了 人 们 受到 他 人 决策 影响 的 情况 ， 
比如 在 观看 视频 和 购买 产品 上 。 我 们 看 到 了 基于 人 口 模型 的 信息 瀑布 
是 如 何 产生 的 ， 同 时 ， 这 部 分 还 揭示 了 为 什么 一 些 YouTube 视 频 出 现 
病毒 式 传播 ， 而 其 他 的 却 没有 。 然 后 我 们 结合 网 络 拓 扑 ， 研 究 如 何 识 


别 和 利用 在 脸 书 和 推 特 等 社交 网 络 平台 上 有 影响 力 的 人 。 

这 里 的 首要 主题 与 第 三 部 分 的 原则 相反 。 面 对 社会 影响 ， 人 们 的 
行为 变 得 相互 依赖 ， 颠 禾 了 群众 智慧 背后 的 基本 假设 。 当 人 们 遵循 彼 
此 的 依赖 时 ， 他 们 就 会 将 信息 传播 给 大 众 ， 即 使 它 是 不 正确 的 。 


第 五 
分 而 
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型 
NT 


在 对 前 四 条 网 络 原则 的 讨论 中 ， 我 们 多 次 提 到 互联 网 。 前 几 章 讨 
论 的 大 部 分 话题 都 依赖 于 它 的 存在 。 当 提 到 它 时 ， 你 可 能 会 想 ， 究 竞 
什么 是 互联 网 ? 它 是 如 何 设 计 、 建 造 和 管理 的 ? 本 书 的 第 五 部 分 和 第 

和 部 分 主要 关于 这 些 问 题 。 剩 下 的 两 条 原则 包含 互联 网 的 一 些 关键 方 


O 


在 这 一 部 分 ， 我 们 将 看 到 互联 网 是 如 何以 可 扩展 的 方式 进行 设计 


管理 的 。 随 着 连接 设备 数量 和 互联 网 规模 不 断 扩大 ， 可 扩展 性 几乎 
en 需要 一 种 共享 网 
络 资源 的 有 效 方法 ， eh i 
能 上 ) 使 各 个 部 分 可 以 更 容易 操作 。 然 后 ， 在 第 12 章 ， 我 们 将 看 到 互 
ee 以 可 扩展 的 方式 将 信息 从 一 点 传 
递 到 另 一 点 ， 分 之 ， 而 后 治之 。 


第 11 章 
发 明 互 联网 


作为 不 同 网 络 的 网 络 ， 互 联网 不 但 是 一 项 非凡 的 技术 和 巨大 的 商业 
成 就 ， 还 体现 了 重要 的 工程 设计 理念 。 我 们 开始 后 面 三 章 的 旅程 ， 但 不 
是 介绍 某 种 技术 ， 而 是 介绍 三 个 重要 的 设计 理念 ， 它 们 使 互联 网 获得 极 
大 的 可 扩展 性 :分 组 交换 、 分 布 式 层次 结构 ， 以 及 模块 化 。 


回顾 分 盏 


你 还 记得 在 本 书 的 第 一 部 分 ， 我 们 谈 到 了 资源 共 孚 吗 ? 我 们 研究 了 
不 同 的 使 用 户 能 够 共享 网 络 资源 的 多 址 访问 技术 。 不 同 频 率 、 不 同时 间 
和 【或 ) 不 同 代 码 传输 ， 都 是 音 用 的 划分 通信 介质 的 方法 。 


通过 从 手机 到 YouTube 服 务 器 的 网 络 ， 如 采 我 们 把 资源 分 配给 你 和 
其 他 所 有 人 ， 上 所 有 传输 都 将 沿 着 自己 的 路 径 ， 从 头 到 尾 被 区 分 。 像 这 样 
的 电路 交换 式 (Circuit-switched) 网 络 属于 给 每 个 用 户 按 固 定 比例 分 
配 资 源 的 网 络 组 。 


你 能 想到 电路 交换 可 能 是 低 效 的 情况 吗 ? 互联 网 数据 应 用 的 突 发 性 
质 如 何 处 理 ， 如 网 页 、 电 子 邮件 和 文件 传输 ? 在 这 些 情况 下 ， 并 非 所 有 
的 网 络 资源 都 会 不 断 使 用 ， 因 为 这 些 传 输 发 生 在 很 多 的 短 时 间 内 。 当 普 
通用 户 不 需要 专用 资源 时 ， 为 什么 不 让 他 们 共 孚 这 些 资源 呢 ? 


我 们 可 以 混合 并 匹配 分 属 不 同 互 联网 会 话 的 信息 ， 使 其 分 享 路 径 。 
这 就 是 分 组 交换 (packet _ switching) 的 本 质 : 把 要 发 送 的 信息 分 成 


更 小 块 的 数据 包 。 每 个 会 话 可 能 穿 过 多 个 路 径 ， 并 且 每 个 链接 由 来 自 不 
同 会 话 的 数据 包 共 至 。 


完 竟 什么 是 互联 网 会 话 (session) ? 这 是 两 个 或 两 个 以 上 通过 互 
联网 连接 的 设备 之 间 的 信息 交换 或 对 话 。 当 会 话 建立 时 ， 资 源 遇 布 从 通 
信和 路 径 一 端 ( 发 送 者 ) 到 男 一 并 (接收 者 的 整个 路 径 。 一 个 会 话 可 以 
有 多 个 来 源 《〈 即 发 送 者 ) 和 多 个 目的 地 《 即 接收 者 ) ， 但 我 们 关注 包含 
一 个 发 送 者 和 一 个 接收 者 的 单 播 (unicast) 会 话 。 


在 图 11-1 中 ， 你 可 以 看 到 分 组 交换 和 电路 交换 的 区 别 。 在 电路 交换 
中 ， 每 个 电路 可 以 占据 一 个 特定 的 频带 ， 或 一 组 专用 的 时 隙 。 在 分 组 交 
换 中 ， 则 没有 专用 电路 。 


mi 


LH Cr 时 间 \ 


发 送 者 ?2 电路 交换 

发 送 者 1 分 组 交换 

lis 数据 包 

i LA 小 8 = 


Qa | 
a 
= 一 
发 送 者 2 接收 者 2 
图 11-1 
注 : 在 电路 交换 〈 上 图 ) 中 ， 每 两 个 会 话 沿 着 链接 各 有 一 个 专用 资源 (在 这 种 情况 


下 是 时 间 ) 。 在 分 组 交换 (下 图 ) 中 ， 每 个 会 话 将 其 消息 分 成 数据 包 ， 并 在 数据 包 
到 达 时 发 送 。 路 径 沿 着 所 有 时 阶 和 频率 共享 


互联 网 的 演变 


20 世 纪 60 年 代 以 前 ， 通 信 网 络 主要 基于 电路 交换 。 互 联网 的 演变 始 
于 20 世 纪 六 七 十 年 代 ， 以 分 组 交换 作为 网 络 基本 范式 的 出 现 为 标志 。 让 
我 们 花 几 分 钟 时 间 ， 来 探讨 一 下 这 个 转变 是 如 何 发 生 的。 同时 ， 这 将 加 
你 介绍 互联 网 背后 的 另外 两 个 重大 理念 一 一 分 布 式 层次 结构 和 分 层 。 


阿 则 网 


20 世 纪 60 年 代 中 期 美国 高 级 研究 计划 署 〈 人 简 称 ARPA) 对 创建 一 
个 基于 分 组 交换 的 大 型 网 络 很 感 兴 趣 。 到 20 世 纪 60 年 代 末 ，ARPA 已 经 
制订 好 了 一 项 将 永远 改变 我 们 生活 的 计划 。 


1969 年 ，ARPA 和 BBN 技 术 公 司 签订 合同 ， 来 研发 可 以 支持 其 计划 
的 计算 机 《接口 通信 处 理 机 ) 。 配 备 了 这 些 机 器 后 ， 加 州 大 学 洛杉矶 分 
校 CUCLA) 、 斯 坦 福 大 学 、 加 州 大 学 圣 塔 双双 拉 分 校 CUCSB) 、 狐 
他 大 学 共同 组 合 出 分 组 交换 网 络 的 第 一 代 原 型 ， 后 来 被 称 为 阿 帕 网 
(ARPANET) 。 同 年 10 月 29 日 ,“1o” 成 为 通过 阿 由 网 发 送 的 第 一 条 文 
本 消息 ， 它 从 加 州 大 学 洛杉矶 分 校 发 送 至 斯 坦 福 。 实 际 上 ， 程 序 员 原 打 
算 发 送 “ 登 录 (login) 一 词 ， 但 是 由 于 编码 错误 ， 在 前 两 个 字母 发 送 
后 ， 系 统 朋 让 了 ， 设 计 团 队 在 一 小 时 后 才 将 其 修复 。 


阿 帕 网 迅速 发 展 : 1970 年 3 月 ， 它 延伸 至 美国 东海 岸 的 马萨诸塞 州 
坎 布 里 奇 ， 到 6 月 ， 有 9 台 机 器 互相 连接 到 12 月 ， 有 13 台 ; 到 次 年 9 
月 ， 网 络 共 有 18 个 站 点 。 你 可 以 在 图 11-2 中 看 到 当时 连接 主机 的 分 布 
图 。1975 年 ， 阿 由 网 正式 宣告 运行 ， 此 时 它 已 发 展 到 约 60 台 机 器 。 


图 11-2 


注 : 阿 帕 网 在 1971 年 9 月 的 分 布 图 ， 显 示 出 最 初 的 18 台 主机 。MIT 表 示 麻 省 理工 学 
院 ，SDC 表 示 系 统 开发 公司 ，SR1 表 示 斯 坦 福 研究 所 ，UCLA 表 示 加 州 大 学 洛杉矶 分 
校 ，UCSB 表 示 加 州 大 学 圣 塔 芭 芭 拉 分 校 

大 约 在 这 个 时 候 ， 罗 伯 特 : 卡 恩 和 温 顿 . 瑟 夫 〈 见 第 五 部 分 和 第 六 并 
分 对 他 们 的 采访 ) 发 表 了 一 篇 具有 里 程 碑 意义 的 论文 ， 这 篇 文章 详细 介 
绍 了 他 们 开发 的 分 组 交换 网 络 的 全 新 协议 (protocol) 。 协 议 本 质 上 
是 设备 用 来 互相 沟通 的 一 套 规则 ， 规 定 了 它们 使 用 的 共同 “语言 "(我 们 
在 第 2 章 讨 论 了 Wi-Fi 随 机 访问 协议 ) 。 这 套 协议 被 称 为 传输 控制 协议 / 
网 际 协 议 ， 简 称 TCP/IP， 并 通过 分 组 交换 网 络 上 的 端 到 端 控 制 进行 ， 
为 连接 阿 由 网 中 的 主机 提供 了 一 种 可 扩展 的 方式 。 重 要 的 是 ， 当 大 量 不 
同 设备 被 添加 到 或 从 网 络 中 删除 时 ， 该 协议 不 需要 修改 ， 这 使 大 规模 的 
互 操 作 性 和 连通 性 成 为 可 能 。 大 约 在 10 年 后 的 1983 年 ，TCP/IP 取 代 了 阿 
由 网 的 最 初 协 议 。 


TCP/IP 也 众生 了 一 个 重要 理念 : 将 互联 网 需要 执行 的 任务 划分 为 不 
同 功能 层 。 一 层 可 以 在 不 影响 另 一 层 协议 操作 的 情况 下 改变 。 作 为 互联 
网 背后 的 一 个 基本 理念 ， 我 们 将 在 本 章 后 面 的 模块 化 部 分 详细 讨论 分 层 


问题 。 


NSFNET 网 络 


20 世 纪 80 年 代 中 期 以 前 ， 资 金 和 授权 问题 使 许多 组 织 无 法 连接 到 阿 
由 网 。 在 这 个 时 候 ， 美 国 国家 科学 基金 会 (NSF) 接管 其 研发 工作 ， 目 
标 是 创造 一 个 学 术 研 究 网 络 ， 使 科学 家 能 访问 全 美 大 型 计算 中 心 。 从 
1985 年 到 1995 年 ， 美 国 国 家 科学 基金 会 资助 创建 和 运行 了 一 个 不 断 发 展 
的 被 称 为 NSFNET 网 络 的 网 络 之 网 络 。 


如 图 11-3 所 示 ，NSFNET 网 络 建立 在 三 层 结构 中 ， 其 中 每 种 类 型 的 
节点 (校园 、 区 域 和 主干 ) 本 号 都 是 网 络 。 校 园 网 通过 区 域 网 连接 在 一 
起 ， 区 域 网 通过 主干 网 相 结合 ， 将 NSFENET 网 络 黏 在 一 起 。 主 和 王 网 首先 
延伸 至 全 美国 ， 后 来 发 展 到 其 他 国家 。 


图 11-3 NSFNET 网 络 的 三 层 网 络 之 网 络 
随 着 更 多 网 络 提 供 商 的 加 入 ，NSFNET 了 网络 不 断 发 展 。 为 了 满足 不 


叶 增 长 的 需求 ， 主 干 的 规模 〈 即 组 成 主干 的 市 点 数量 ) 和 速度 〈 即 连接 
节点 的 链接 速度 ) 必须 在 不 同时 间 有 所 改进 。1986 年 主干 有 6 个 市 皮 ， 


链接 速度 达到 56 kbps (56 000 比 特 / 秒 ) 。 到 1991 年 主干 已 经 扩展 到 14 个 
节点 ， 链 接 速 度 为 1.5 Mbps (150 万 比特 / 秒 ) 。 在 图 11-4 中 ， 你 可 以 看 
到 ， 当 时 的 网 络 连 接 已 经 变 得 非常 密集 和 丰富 了 。 


图 11-4 1991 年 美国 的 NSFNET 网 络 示意 图 
注 : 主干 节点 以 粗 线 绘制 在 顶部 ， 而 区 域 网 络 在 地 图 上 被 标 出 


NSFNET 网 络 以 研究 和 教育 的 名 义 拨款 ， 用 于 科学 和 工程 目的 。 严 
格 地 说 ， 它 不 允许 被 用 于 商业 活动 (参考 本 书 网 站 Q11.1 部 分 ， 了 人 解 部 
分 相关 政策 ) 。 这 种 情况 很 快 就 改变 了 。 随 着 需求 的 增加 ， 在 20 世 纪 90 
年 代 早 期 ， 一 些 互 联网 服务 提供 商 〈ISP) 出 现 ， 它 们 将 互联 网 扩展 至 
公共 用 途 〈 我 们 在 第 3 章 谈 到 ， 互 联网 服务 供应 商 基 于 数据 使 用 向 用 户 
收费 ) 。 商 业 利 益 和 企业 活动 极 大 地 扩展 了 这 个 相互 关联 的 网 络 之 网 
络 。 到 1994 年 ， 作 为 用 户 界 面 的 万 维 网 和 网 络 浏览 器 已 经 成 熟 ， 世 界 各 
地 很 快 着 手 开发 在 网 络 上 运行 的 商业 应 用 程序 ， 电 子 邮 件 、 文 件 共 享 、 


浏览 网 页 ， 应 有 尺 有 。 


1995 年 ，NSFNET 网 络 正式 退役 ， 并 被 商业 互联 网 取代 。 在 接 下 来 
的 20 年 里 ， 互 联网 成 为 我 们 日 常生 活 中 必 不 可 少 的 一 部 分 ， 世 界 各 地 联 
网 的 人 和 设备 数量 每 年 都 在 迅速 增长 ， 这 要 部 分 归功 于 技术 进步 和 可 扩 
展 的 分 而 治之 的 设计 原则 。2005 年 ， 在 家 上 网 的 人 数 达到 10 亿 ，2010 年 
达到 20 亿 ，2014 年 达到 30 亿 。2014 年 ， 世 界 上 已 有 大 约 120 亿 人 台 互 联网 
连接 设备 ， 这 表示 全 世界 平均 每 个 人 拥有 1.7 台 设备 。 随 着 物 联网 
(Internet of Things， 简 称 IoT) 鞍 勃 发 展 ， 到 2020 年 ， 这 两 个 数字 
预计 将 增加 三 倍 ， 即 有 330 亿 台 设 备 ， 每 人 4.3 台 。 


了 解 互联 网 演变 的 简 史 后 ， 我 们 现在 看 看 三 个 关键 的 建构 理念 。 首 
先 回 到 之 前 提 到 的 分 组 交换 。 


分 组 和 电路 


专用 资源 和 共享 资源 分 配 之 间 的 争论 由 来 已 入。 电路 交换 或 专用 资 
源 分 配 有 一 个 很 大 的 优势 ; 保证 质量 。 每 个 会 话 都 有 专门 的 电路 。 正 因 
为 如 此 ， 知 吐 性 能 《成 功 传递 消息 的 速率 ) 和 延迟 性 能 《传递 一 条 消息 
所 需 的 时 间 ) 都 可 以 得 到 保证 。 


与 此 相反 ， 分 组 交换 网 络 中 的 会 话 可 以 彼此 共 孚 路 径 。 任 何 一 个 会 
话 的 流量 也 可 以 被 分 配 到 不 同 路 径 。 一 条 消息 的 不 同 部 分 可 以 不 按 顺 序 
到 达 目 的 地 《接收 器 可 以 重新 排序 ) ， 而 路 径 中 的 链接 会 变 得 拥挤 。 和 在 
吐 和 延迟 性 能 变 得 不 确定 。 面 对 这 种 不 确定 性 ， 互 联网 声称 将 提供 最 大 
努力 的 (best-effort) 服务 ， 这 表示 它 将 尽 最 大 努力 ， 以 高 性 能 来 传 
递 信息 。 不 过 ， 这 一 点 没有 任何 保证 ， 也 许 对 其 更 准确 的 描述 是 并 没有 
努力 去 保证 性 能 。 


但 是 分 组 交换 有 两 大 优势 。 首 先 ， 它 提供 了 连接 的 便利 性 ， 不 需要 
为 每 个 会 话 搜索 、 建 立 和 维护 端 到 端的 资源 。 网 络 不 必 确 保 你 的 资源 为 
你 保存 ， 你 也 不 必 等 竺 资源 保存 。 只 要 遵循 互联 网 协议 ， 设 备 就 可 以 随 
意 传输 。 


第 二 个 优点 是 可 扩展 性 。 我 们 已 经 看 到 ， 在 很 多 情况 下 ， 可 扩展 性 
古 网 络 的 一 个 重要 性 质 ， 从 支持 单元 中 的 数 百 个 用 户 间 的 功率 控制 (第 
1 章 ) ， 到 在 巨大 的 网 络 图 中 迅速 运行 网 页 级 别 《〈“ 第 5 章 ) ， 再 到 从 大 规 
模 在 线 课程 中 获得 有 效 的 社会 化 学 习 《〈 第 8 章 ) 。 在 这 种 情况 下 ， 可 扩 
展 性 是 指 分 组 交换 网 络 承担 大 量 不 同 会 话 的 能 力 ， 有 的 会 话 持续 时 间 
短 ， 其 他 的 又 会 很 长 。 


分 组 交换 如 何 获 得 可 扩展 性 ? 答案 是 ， 通 过 对 网 络 资源 的 高 效 利用 
实现 。 是 什么 使 它 如 此 高 效 ” 有 两 个 “秘方 ”， 首 先是 统计 多 工 
(statistical multiplexing) : 许多 会 话 可 以 共享 一 条 路 径 和 路 径 上 
的 资源 。 其 次 是 资源 池 (resource pooling) ， 这 是 对 统计 多 工 的 补 
充 : 一 个 会 话 可 以 使 用 许多 路 径 。 让 我 们 对 其 进行 详细 讨论 。 


使 更 大 的 变 得 更 好 ; 统计 多 工 


在 分 组 交换 网 络 中 ， 在 每 条 占用 其 中 所 有 资源 的 路 径 上 ， 不 只 有 一 
个 会 话 。 由 于 会 话 没 有 专用 资源 ， 所 以 它们 在 空闲 时 不 会 浪费 任何 资 
源 。 其 他 在 空闲 期 间 有 需求 的 会 话 可 以 使 用 任何 未 使 用 的 资源 。 


看 看 图 11-5。 在 菜 些 时 险 ， 爱 丽 丝 的 需求 比 鲍 勃 高 得 多 。 在 电路 交 
换 中 ， 每 个 会 话 会 分 配 到 不 同 的 时 际 ， 每 个 都 会 保持 在 其 电路 中 ， 这 区 
会 导致 鲍 动 分 配 到 的 许多 时 际 被 浪费 。 分 组 交换 允许 爱丽 丝 填 补 这 个 空 
闲 时 间 。 只 要 还 有 未 满足 的 需求 ， 就 有 可 供应 的 资源 。 


BA 2 


鲍 动 
图 11-5 

注 : 在 线路 交换 网 络 中 ， 鲍 过 的 部 分 专用 时 隙 将 在 他 需求 低 时 被 浪费 。 在 分 组 交换 
中 ， 多 个 会 话 可 以 使 用 相同 的 资源 ， 允 许 爱 丽 丝 填补 鲍 勃 的 多 余 供应 

在 第 一 部 分 ， 我 们 用 鸡尾酒 会 的 比喻 来 说 明 不 同 的 多 址 访问 技术 。 
如 果 每 个 人 在 同一 个 房间 里 轮流 发 言 〈 即 共享 一 条 路 径 ) ， 当 轮 到 其 中 
一 组 ， 他 们 却 没 有 什么 要 说 的 时 候 ， 会 发 生 什 么 ? 在 电路 交换 中 ， 什 么 
都 不 会 发 生 ， 而 且 将 出 现 一 个 静默 期 ， 在 此 期 间 ， 其 他 人 和 希望 可 以 填补 
死 区 时 间 。 分 组 交换 将 通过 统计 多 工 ， 避 免 浪 费时 间 。 


使 更 大 的 变 得 更 好 : 资源 池 
一 个 会 话 还 可 以 使 用 多 个 路 径 ， 在 分 组 交换 网 络 中 传输 信息 。 在 突 
发 流量 的 情况 下 ， 演 示 资 源 池 的 效率 可 能 会 相当 复杂 ， 但 基本 理念 直 截 


了 当 : 与 其 拥有 两 套 资源 ， 如 两 条 孤立 的 链接 ， 不 如 把 它们 合并 起 来 ， 
将 其 作为 一 个 大 的 资源 使 用 。 


看 看 图 11-6。 有 两 个 会 话 和 两 条 链接 。 在 茶 个 时 间 ， 爱 丽 丝 有 很 高 
的 需求 ， 需 求 不 能 被 顶部 链接 上 可 用 的 容量 满足 。 相 反 ， 在 此 期 间 ， 鲍 
动 在 的 部 链接 有 较 低 需 求 和 较 低 链接 利用 京 。 通 过 将 两 个 链接 肾 合 成 一 
个 更 大 的 资源 池 ， 网 络 就 能 够 满足 爱丽 丝 在 这 段 时 间 内 部 分 剩余 的 突 改 
需求 《哪怕 不 能 全 部 满足 ) 。 在 将 路 径 作为 共享 资源 而 不 是 专用 电路 


时 ， 分 组 交换 采用 资源 池 。 
爱丽 丝 


lo. 


EN | 国 国 国 国 国 国 国 国 ， 。。 


二 
= 


鲍 支 
图 11-6 

注 : 在 某 个 时 间 ， 爱 丽 丝 的 需求 超出 顶部 链接 可 以 满足 的 范围 ， 而 鲍 勃 的 需求 比 底 
部 链接 的 容量 少 得 多 。 在 分 组 交换 中 ， 这 两 个 链接 被 看 作 是 一 个 汇集 的 资源 ， 允 许 
爱丽 丝 的 一 些 消息 通过 底部 链接 传输 

再 次 回 到 鸡尾酒 会 的 比喻 。 假 设 有 两 个 房间 〈 即 两 个 链接 ) ， 每 个 
房间 内 有 10 对 人 交谈 。 这 些 房间 都 很 小 ， 所 以 相当 不 舒服 和 拥挤 。 然 
后 ， 在 其 中 一 个 房间 ， 有 6 对 人 决定 离开 。 这 个 房间 里 剩 下 4 对 人 ， 男 一 
间 里 有 10 对 人 。 分 组 交换 将 平衡 每 个 房间 的 需求 ， 让 拥挤 房间 里 的 3 对 
人 换 到 较 宽 松 的 房间 ， 以 缓解 拥堵 。 电 路 交换 将 这 些 房间 视 为 两 个 独立 
的 资源 ， 不 会 试图 将 会 话 从 一 个 房间 转 到 另 一 个 。 


图 11-7 总 结 了 我 们 已 经 讨论 的 分 组 交换 和 电路 交换 带 给 网 络 的 三 个 
关键 区 别 。 归 根 结 感 ， 相 比 保证 质量 ， 对 于 互联 网 来 说 ， 容 易 提 供 连 接 
和 为 许多 不 同 用 户 进 行 扩展 的 能 力 更 具 吸 引力 ， 不 过 入 们 直到 21 世 纪 初 
才 完 全 明白 这 一 点 。 质 量 保证 固然 不 错 ， 但 另外 两 个 特性 对 于 互联 网 这 
样 的 大 型 动态 网 络 也 必 不 可 少 。 一 旦 网 络 以 简单 和 可 扩展 的 方式 发 展 ， 
我 们 就 可 以 寻找 其 他 的 解决 方案 ， 以 应 对 质量 的 变化 。 


特性 电路 交换 分 组 交换 


质量 保证 x 
连接 便利 性 Vv 
可 扩展 性 v 


图 11-7 分 组 交换 与 电路 交换 在 三 个 重要 网 络 特性 方面 的 区 别 


分 布 式 层 次 结构 : 空间 划分 


所 以 ， 分 组 交换 非常 适合 处 理 动态 、 突 发 的 流量 。 然 而 ， 管 理 这 样 
的 网 络 是 相当 复杂 的 ， 有 如 下 几 个 原因 。 一 个 显而易见 的 问题 是 互联 网 
的 规模 ， 我 们 说 过 ， 使 用 互联 网 的 人 数 已 经 十 分 庞大 。 


与 此 相关 的 是 ， 互 联网 已 经 延伸 到 地 球 上 几乎 每 一 个 角落 。 许 多 不 
同 的 互联 网 服务 供应 商 已 经 出 现在 世界 各 地 ， 每 个 都 拥有 和 人 负责 网 络 的 
不 同 部 分 。 任 何 给 定 的 端 到 端 网 络 会 话 都 可 能 穿越 多 个 供应 商 之 间 的 链 
接 。 例 如 ， 一 个 从 谷歌 到 你 的 苹果 手机 的 YouTube 会 话 将 通过 一 个 无 线 
传输 界面 ， 然 后 (如 果 你 没有 连接 到 Wi-Fi)〉 可 能 通过 蜂 久 网 络 核心 的 
儿 个 链接 ， 之 后 是 穿越 不 同 供应 商 的 一 系列 更 多 的 链接 。 


每 个 供应 丙 位 于 整体 层次 结构 的 不 同 级 别 。 这 些 级 别 以 类 似 于 
NSFNET 网 络 结构 的 形式 分 布 : 有 三 个 不 同 的 层次 ， 如 图 11-8 所 示 。 


图 11-8 互联 网 将 互联 网 服务 提供 商 (ISPs) 分 为 不 同 层次 


注 : 一 级 互联 网 服务 提供 商都 互相 连接 ， 组 成 互联 网 的 主干 。 其 中 每 个 一 级 提供 商 
都 连接 到 多 个 二 级 提供 商 ， 二 级 提供 商 又 连接 到 三 级 提供 商 

在 第 一 层 中 ， 有 一 些 非常 大 的 供应 商 ， 称 为 一 级 互联 网 服务 供应 商 
(tier-1 ISPs) 。 每 个 一 级 供应 商都 覆 善 全球， 它们 可 以 不 经 过 较 低 级 
别 就 到 达 其 他 一 级 供应 商 。 这 意味 着 它们 形成 了 同 级 (Peering) 关 
系 ， 并 可 以 通过 彼此 的 流量 。 一 级 供应 丙 的 全 部 网 络 有 时 也 称 为 互联 网 
主干 网 ， 就 像 NSFNET 网 络 一 样 。 这 样 的 例子 包括 AT&T、 威 瑞 森 、 英 
国电 信 、 三 级 通信 和 日 本 电报 电话 公司 。 


在 第 二 层 ， 更 多 徐 盖 部 分 地 区 的 供应 商 成 为 二 级 互联 网 服务 供应 商 
(tier-2 ISPs) 。 它 们 也 可 能 在 彼此 之 间 形 成 同 级 关系， 但 无 法 不 通过 
其 一 级 供应 两 就 到 达 互 联网 主干 网 。 当 一 个 二 级 供应 商 和 一 级 供应 商 进 


行 连接 ， 两 者 形成 客户 -供应 商 (customer-provider) 关系 ， 二 级 供 
应 商 需 要 向 一 级 供应 商 付费 ， 以 使 其 流量 通过 。 


最 后 ， 每 个 二 级 供应 商 向 许多 三 级 互联 网 服务 供应 南 (tier-3 
ISPs) 提供 连接 ， 形 成 男 一 种 类 型 的 客户 -供应 商 关 系 。 三 级 供应 两 只 
和 和 客户 产生 流量 往来 ， 和 其 他 供应 商 则 没有 。 例 如 ， 学 校 、 企 业 和 农村 
地 区 的 住宅 互联 网 服务 供应 两 属于 这 个 类 别 。 


每 个 供应 商 和 互联 网 上 的 相关 行政 单位 形成 一 个 自治 系统 
(autonomous system) ， 简称 AS。 截 至 2014 年 年 中 ， 在 整个 互联 
网 上 有 超过 45 000 个 自治 系统 ， 而 2008 年 年 底 时 仅 有 30 000 个 。 这 是 互 
联网 规模 之 大 和 地 理 分 布 之 广 的 另 一 个 例子 。 事 实 上 ， 处 理 保 持 在 自治 
系统 内 部 《简称 系统 内 ) 的 互联 网 流量 ， 和 处 理 穿越 两 个 或 两 个 以 上 自 
治 系统 《简称 系统 间 ) 的 流量 大 不 相同 。 让 每 个 自治 系统 管理 自己 的 流 
量 ， 是 一 种 通过 在 空间 上 分 配 控制 ， 扩 展 互联 网 的 方法 。 


也 不 是 所 有 的 通信 和 都 必须 通过 整个 网 络 。 在 物 联网 和 沉浸 式 人 工 智 
能 应 用 的 推动 下 ， 比 如 说 ， 模糊 (fog) 结构 正 准备 使 计算 、 存 储 、 控 
制 和 通信 更 接近 最 终 用 户 。 


模块 化 : 功能 划分 


互联 网 的 复杂 性 来 自 它 的 规模 及 其 需要 处 理 的 许多 任务 规模 。 它 需 
要 通过 网 络 传递 消息 、 控 制 拥塞、 运行 应 用 程序 、 建 立会 话 以 及 执行 许 
多 其 他 功能 。 如 何 管理 所 有 这 些 任务 ? 当 设 计 制 造 如 此 复杂 的 系统 时 ， 
自然 要 将 功能 模 世 化 ， 即 将 其 分 割 成 可 以 单独 管理 的 更 小 的 雁 片 。 分 
之 ， 而 后 治之 。 


扒 登 协议 : 用 分 层 进行 分 解 


模块 化 网 络 任务 产生 所 谓 的 分 层 协议 栈 (layered protocol 
stack) 。 协 议 栈 中 的 每 一 层 都 有 不 同 用 途 ， 负 责 可 以 共同 管理 的 不 同 


图 11-9 显 示 了 一 个 典型 的 与 互联 网 相关 的 协议 栈 。 这 里 有 5 个 层 
级 : 物理 、 链 接 、 网 络 、 传 输 和 应 用 。 它 们 从 底部 到 顶部 被 称 为 第 1 层 
(物理 ) 至 第 5 层 〈 应 用 ) ， 每 一 层 都 会 使 用 下 层 提 供 的 服务 ， 又 反 过 
来 为 上 层 提供 服务 。 


图 11-9 


注 : 与 互联 网 相关 的 典型 协议 栈 ， 由 5 个 层级 组 成 (1P: 互联 网 协议 ; TCP: 传输 控 
制 协议 ; UDP: 用 户 数据 报 协 议 。) 


让 我 们 有 具体 看 看 这 个 协议 栈 。 在 撒 部 是 物理 层 和 链接 层 ， 即 1 和 2。 


物理 层 (physical layer) 处 理 信号 在 网 络 介质 上 的 传输 。 这 种 介质 可 
以 是 钢 线 、 光 纤 电 绵 、 无 线 接口 等 。 链 接 层 (link layer) 反 过 来 管理 
设备 对 网 络 介质 的 访问 。 它 表现 得 像 一 个 附近 的 交通 警察 ， 为 争夺 进入 
道路 《〈 即 链接 ) 的 双方 进行 仲裁 。 例 如 ， 我 们 在 第 一 部 分 看 到 的 功率 控 
制 和 随机 访问 就 是 在 这 些 层 上 运行 的 功能 。 


在 中 间 是 网 络 层 和 传输 屋 ， 即 3 和 4: 


。 网 络 层 (network layer) 负责 逐 跳 和 逐 链 接 路 由 。 它 使 用 
ep, 路 由 的 重要 功能 发 生 在 这 层 ， 这 一 点 我 们 将 在 第 12 章 
讨论 。 

传输 层 (transport layer) 主要 管理 端 到 端的 会 话 ， 使 用 
TCP 作 为 其 主要 协议 。 我 们 将 在 第 13 章 了 解 拥塞 控制 ， 这 是 该 层 处 理 
的 重要 功能 


在 顶部 是 应 用 层 (application layer) ， 即 5。 作 为 互联 网 的 最 终 
用 户 ， 这 层 对 于 我 们 最 显而易见 。 本 书 中 讨论 的 许多 网 络 都 是 由 我 们 每 
天 互动 的 不 同 应 用 组 成 : 电子 邮件 、 移 动 应 用 程序 、 内 容 共 享 
等 。 自 20 世 纪 90 年 代 以 来 ， 这 一 层 的 一 个 共同 协议 是 超 文本 传输 协议 ， 
se 


正如 我 们 所 说 ， 每 一 层 都 为 上 层 提 供 服务 ， 并 使 用 下 层 的 服务 。 例 
如 ， 传 输 层 4 为 上 面 运行 应 用 的 第 5 层 提供 端 到 端 连接 ， 提 供 会 话 建 并 、 
数据 包 重 新 排序 和 拥 赛 控制 的 服务 。 反 过 来 ， 传 输 层 从 它 下 面 的 网 络 层 
3 获取 服务 ， 包 括 通过 路 由 建立 的 连接 。 


在 互联 网 发 展 的 简短 历程 中 ， 物 理 媒介 的 传输 速度 已 经 提高 了 30 
000 倍 以 上 ， 从 32 Kbps 的 拨号 上 网 到 10 Gbps 的 光纤 和 100 Mbps 的 无 线 
网 络 。 互 联网 上 运行 的 应 用 程序 ， 已 经 从 适合 专业 人 士 的 用 于 文件 传输 
《现在 仍然 有 它们 的 一 席 之 地 ) 的 命令 行 工 具 ， 发 展 到 适合 消费 者 的 网 


站 ， 如 网 飞 和 推 特 。 然 而 ， 互 联网 本 身 经 过 这 些 不 可 思议 的 转变， 仍然 
继续 运行 ， 这 在 很 大 程度 上 要 归功 于 TCP/IP 协 议 ， 因 为 在 应 用 程序 和 通 
信 媒 体 变 化 时 ， 它 仍然 大 体 保持 不 变 。 


图 11-9 中 的 水 平 线 是 指 各 层 之 间 的 边界 。 它 们 实际 上 有 是 非常 复杂 的 
对 象 ， 表 示 对 每 一 层 可 以 做 什么 、 能 看 到 什么 以 及 负责 什么 的 限制 。 这 
些 边 界 也 是 不 明确 的 ， 因 为 各 层 之 间 出 现 了 一 些 功能 重 登 。 一 个 典型 的 
例子 是 误差 控制 ， 它 由 在 检测 和 处 理 传输 中 的 错误 。 每 一 层 都 执行 一 定 
量 的 该 任务 。 重 有 登 是 故意 制造 的 ， 产 生 的 功能 见 余 有 助 于 确保 稳健 性 ， 
同时 允许 网 络 通 过 分 层 结 构 太 展 。 


根据 协议 栈 划 分 任务 ， 互 联网 可 以 随 着 功能 集 的 增长 而 扩展 ， 管 理 
每 一 层 。 


面 癌 连接 和 无 连接 


你 可 能 已 经 注意 到 ， 我 们 在 本 章 开始 介绍 TCP 和 IP 时 ， 将 它们 并 称 
为 TCP/P。 如 果 它 们 是 在 不 同 的 层 中 使 用 ， 为 什么 要 这 样 称呼 ? 事实 
上 ， 互 联网 的 初始 版 本 将 TCP/IP 作 为 一 个 单独 的 协议 ， 管 理 逐 跳 路 由 和 
端 到 端的 会 话 。 根 据 分 层 和 模块 化 的 原则 ， 在 20 世 纪 80 年 代 初 ，TCP 和 
IP 正 式 分 为 两 部 分 ， 分 别 服务 传输 层 和 网 络 层 。 


在 这 两 层 之 间 ， 人 们 已 经 做 出 了 许多 有 趣 的 建构 决策 。 传 输 层 负责 
端 到 端的 管理 ， 在 TCP 中 是 面向 连接 的 (connection-oriented) ， 而 
网 络 层 负责 逐 路 管理， 在 卫 中 是 无 连接 的 (connectionless) 。 你 可 
以 在 图 11-10 中 看 到 这 个 区 别 。 这 种 责任 划分 意味 着 ， 网 络 层 不 关心 链 
接 的 拥塞 或 负载 情况 。 这 时 就 需要 传输 层 来 解决 ，TCP 在 这 种 情况 下 ， 
负责 管理 终端 主机 的 需求 。 


发 送 器 +-------------- 二 > 接收 器 
El 
国 | 一 1 
2 逐 跳 Wu 
到 路 由 器 +----- > 路 由 器 路 由 器 ee 
多 学 时 加 ED 品 口 ED 网 
图 11-10 


注 : 传输 层 《第 4 层 ， 见 图 11 -9) 负责 端 到 端的 会 话 管理 ， 而 网 络 层 〈 第 3 层 ) 负责 
逐 跳 管理 

面向 连接 和 无 连接 通信 之 间 的 差异 ， 也 可 以 通过 类 比 电话 和 邮寄 信 
件 (图 11-11) 来 理解 。 如 果 你 打 电 话 给 某 人 ， 在 你 开始 和 对 方 交 谈 之 
前 ， 他 必须 得 知 你 在 打 电 话 〈 电 话 铃 啊 ) ， 并 拿 起 听 简 。 这 样 ， 你 在 通 
话 之 前 就 与 对 方 建立 起 连接 。 相 反 ， 想 想 当 你 给 某 人 写 信 时 会 友 生 什 
么 。 途 中 每 一 个 收 到 信 的 中 间 邮 局 只 关心 它 接 下 来 去 哪里 ， 而 不 是 它 来 
自 哪 里 或 者 最 终 应 该 到 哪里 。 它 只 使 用 最 终 目 的 地 来 确定 路 径 上 的 下 一 
跳 。 在 这 个 无 连接 的 过 程 中 ， 收 信人 甚至 可 能 不 知道 这 封 信 正在 途中 。 
我 们 将 在 第 12 章 讨论 路 由 系统 时 ， 回 到 这 个 邮政 系统 的 类 比 。 


面 问 连接 
图 11-11 
注 : 打 电 话 和 邮寄 信件 类 似 于 面向 连接 和 无 连接 通信 


模块 化 的 开销 


我 们 提 到 在 互联 网 上 发 送 的 东西 时 ， 经 常 使 用 “消息 ”这 个 词 ， 如 电 
子 邮 件 和 即时 消息 等 。 从 技术 上 讲 ， 消 息 (message) 是 应 用 层 产 生 
数据 的 基本 单位 。 一 条 消息 被 传送 前 ， 协 议 栈 中 的 每 层 会 在 上 面 添加 自 
己 的 头 信 息 (header) ， 这 样 网 络 中 每 个 节点 的 协议 栈 各 层 可 以 解读 
其 相应 的 头 信息 。 从 顶部 的 第 5 层 开 始 ， 一 直到 第 1 层 ， 以 下 是 将 数据 封 
装 (encapsulated) 传输 的 过 程 : 


第 5 层 : 当 某 个 互联 网 用 户 想 要 发 送 消息 时 ， 他 的 设备 让 应 用 
层 生 成 一 个 要 传输 的 消息 序列 。 

第 4 层 : 每 个 消息 在 传输 层 被 划分 成 段 (Segment) 。 每 段 包 
含 两 部 分 : 有 效 载荷 (payload) ， 这 是 来 自 消息 的 部 分 实际 内 容 
以 及 在 前 面 添加 一 个 第 4 层 头 信息 的 有 效 载荷 。 


第 3 层 : 然后 各 段 被 传递 到 网 络 层 ， 对 方 将 其 划分 并 封装 为 数 
据 报 或 数据 包 (packet) 。 每 个 数据 包 前 面 都 有 一 个 第 3 层 的 头 信 
自 


人 > Oo 


第 2 层 : 每 个 数据 包 被 进一步 传递 到 链接 层 ， 对 方 添加 一 个 第 2 
层 头 信息 ， 以 形成 一 个 帧 。 


第 1 层 : 最 后 ， 所 有 帧 都 传递 到 物理 层 ， 作 为 比特 传输 。 


你 可 以 在 图 11-12 中 看 到 这 个 过 程 。 


图 11-12 
注 : 协议 栈 中 的 各 层 将 自己 的 头 信 息 添 加 到 消息 中 ， 在 互联 网 上 传输 之 前 将 其 封装 


计算 机 、 路 由 器 、 调 制 解 调 器 、 服 务 器 等 网 络 中 的 不 同 设备 运行 分 
层 协 议 栈 的 不 同 子 集 。 每 一 个 设备 都 将 解 封 (decapsulate) 〈 即 解 
码 ) 并 读 取 与 其 运行 的 头 信息 相关 的 子 集 。 如 果 它 是 路 径 上 的 中 间 节 
点 ， 它 将 再 次 封装 这 些 层 并 继续 发 送信 息 。 在 图 11-13 中 可 以 发 现 一 些 
重要 的 情况 : 


智能 手机 交换 机 路 由 需 服务 禹 


图 11-13 不 同 网 络 元 素 处 理 协议 栈 中 的 不 同 层 
。 计算 机 和 服务 器 作为 终端 主机 ， 处 理 所 有 的 五 层 。 
。 路 由 器 (router) 作为 网 络 级 别 设备 ， 处 理 到 第 3 层 。 这 就 要 
求 它们 拥有 并 处 理 IP 地 址 。 
。 交 换 机 (switch) 作为 链接 层 设 备 ， 只 处 理 到 第 2 层 。 它 们 并 
不 拥有 或 处 理 1P 地 址 。 


封装 可 能 看 起 来 不 必要 而 多 余 。 这 样 说 是 对 的 ， 这 个 过 程 会 产生 控 
制 开 销 (overhead) ， 这 是 分 层 架 构 中 众多 见 余 和 开销 的 一 种 ， 因 为 
网 络 中 发 送 的 大 量 数据 不 是 实际 内 容 。 那 么 ， 为 什么 一 开始 要 在 层 里 添 
加 头 信 息 呢 ? 这 是 一 种 对 分 组 交换 网 络 中 不 同 传输 进行 区 分 和 提供 信息 
的 方式 ， 比 如 它们 来 目 哪 里 ， 要 去 哪里 ， 以 及 传输 多 久 。 例 如 ， 第 3 层 
的 头 信息 包含 源 和 目的 耳 地 址 ， 这 《我 们 将 在 第 12 章 中 看 到 ) 对 于 互联 
网 的 路 由 任务 是 必 不 可 少 的 。 同 样 ， 通 过 允许 所 有 人 共享 相同 的 网 络 资 
源 ， 分 组 交换 可 以 取得 比 电 路 交换 更 高 的 效率 ， 但 我 们 需要 区 分 传输 目 
号 内 部 的 不 同 会 话 。 


分 组 交换 、 分 布 式 层次 结构 和 分 层 是 互联 网 背后 的 三 个 基本 概念。 
它们 使 互联 网 实现 有 效 扩 展 ， 以 满足 更 高 的 需求 ， 实 现 更 广泛 的 地 理 分 
布 ， 以 及 处 理 更 多 的 功能 。 但 我 们 的 探索 才刚 刚 开始 。 管 理 不 断 扩大 的 
网 络 之 网 络 涉及 许多 任务 : 我 们 必须 弄 清楚 如 何 从 A 点 到 B 点 ， 管 理 链 
接 中 的 拥塞 ， 等 等 。 我 们 在 图 11-8 中 对 自治 系统 的 讨论 是 到 下 一 章 的 恰 
当 过 渡 ， 接 下 来 我 们 将 关注 自治 系统 内 部 路 由 。 


第 12 章 
路 由 沉 量 


流量 是 如 何 通 过 互联 网 ， 从 一 个 地 方 到 达 另 一 个 地 方 的 ? 一 个 简短 
的 答案 是 网 络 中 包含 称 为 路 由 器 的 设备 ， 控 制 数 据 包 的 传输 方向 。 用 通 
俗 的 语言 解释 ， 互 联网 上 的 路 由 (routing) 类 似 于 你 开车 前 往 某 处 
时 ， 其 目的 是 确定 你 会 遵循 哪 条 路 线 。 在 研究 确定 数据 包 路 由 的 方法 之 
前 ， 让 我 们 先 来 看 一 看 主要 概念 。 


互联 网 的 “邮政 服务 ” 


正如 我 们 之 前 看 到 的 ， 交 通 网 络 可 以 为 通信 和 网络 提供 有 用 的 类 比 ， 
邮政 服务 则 为 互联 网 路 由 提供 了 有 趣 的 类 比 。 要 提供 发 送 者 到 接收 者 的 
路 由 ， 我 们 需要 三 个 主要 功能 : 寻 址 、 路 由 和 转发 。 有 时 这 三 个 术语 在 
非 正 式 表达 中 被 混为一谈 ， 但 它们 其 实 是 不 同 的 步骤 。 


寻 址 


当 你 邮递 信件 时 ， 需 要 在 信封 上 写 下 地 址 〈 图 12-1) 。 人 否则 ， 邮 政 
局 就 不 知道 该 怎么 处 理 这 封 信 。 你 把 收 件 人 的 街道 地 址 、 城 镇 、 州 、 国 
家 名 称 和 邮政 编码 写 在 前 面 ， 告 诉 邮 局 应 该 把 信 投 化 到 哪里 。 你 把 你 的 
地 址 也 写 在 信封 上 ， 这 样 信 的 来 源 就 清楚 了， 同时 万 一 路 上 出 现 什 么 问 
题 也 有 用 。 


全 J 的 9 窗 斯 
六 定 路 7 号 本 时 
谢 润 高 地 ， NJ 07303 收 信人 标识 


EC 


水 景 道 81 号 
思平 原 ，GA 30005 


图 12-1 

注 : 在 信封 上 写 地 址 ， 通 过 邮政 系统 发 送 ， 类 似 于 为 消息 写 上 地 址 ， 通 过 互联 网 发 
送 

收 件 人 的 邮政 地 址 给 了 他 一 个 独特 的 标签 ， 这 是 世界 上 没有 其 他 人 
共享 的 〈 除 了 住 在 同一 个 房子 里 的 人 ) ， 所 以 关于 你 希望 把 信 寄 到 哪里 
这 个 问题 ， 没 有 含混 不 清 的 地 方 。 这 也 是 互联 网 的 寻 址 方式 : 我 们 给 网 
络 中 的 每 个 节点 贴 上 唯一 的 标签 ， 这 样 我 们 就 可 以 识别 消息 的 来 源 和 目 
的 地 。 特 别 是 ， 每 个 网 络 设备 都 会 被 分 配 一 个 互联 网 协议 地 址 ， 即 IP 地 
址 (IP address) 。IP 地 址 通常 表示 为 用 点 分 开 的 小 数 ， 例 如 
127.12.5.88， 数 字 介 于 0 和 255 之 间 。 


在 图 12-2 中 ， 你 可 以 看 到 一 些 家 中 常见 的 互联 网 设备 ， 其 中 有 些 营 
常会 被 分 配 IP 地 址 。 第 11 间 曾 提 到 ， 调 制 解 调 器 等 一 些 设备 不 使 用 互联 
网 协议 进行 通信 ， 因 此 不 需要 分 配 IP 地 址 。 


121:12:3:89 


无 IP 7 1 


互联 网 调制 解 调 需 路 由 器 


笔记 本 电脑 


127.12.3:88 


[| 


台式 电脑 
图 12-2 网 络 设备 被 分 配 称 为 IP 地 址 的 唯一 标识 符 


IP 有 两 个 版 本 ， 版 本 4 和 版 本 6。1Pv4 的 地 址 使 用 四 组 数字 (例如 
127.12.5.88) ， 可 以 分 配 超过 40 亿 个 有 效 地 址 。 截 至 2011 年 年 初 ，40 亿 
个 地 址 已 经 不 够 用 。1Pv6 的 地 址 被 设计 为 使 用 相当 于 16 组 数字 ， 提 供 40 
亿 x40 亿 x40 亿 x40 亿 个 有 效 地 址 。 这 上 听 起 来 似乎 太 大 而 没有 必要 《如 第 9 
章 提 到 的 64 位 YouTube 浏 览 计 数 器 ) ， 但 随 着 互联 网 连接 设备 的 扩散 ， 
这 已 被 证 明 是 一 个 明智 的 选择 ， 特 别 是 考虑 到 这 些 地 址 将 被 分 配 到 物 联 
网 中 。 


让 我 们 深入 了 解 一 下 邮政 系统 的 类 比 。 与 邮寄 地 址 的 邮政 编码 将 信 
送 达 特 定 的 城镇 或 城市 相似 ， 卫 地 址 前 缀 (prefix) 将 互联 网 信息 送 达 
目的 路 由 器 。 对 于 IPv4 地 址 ， 最 左边 的 3 个 数字 可 能 表示 前 级 (不 过 它 
可 能 更 长 或 更 短 ) 。 它 由 一 条 斜 杠 标 出 : 127.12.5.0/24， 这 表示 该 地 址 
的 前 级 是 127.12.5。 为 什么 24 可 以 代表 前 3 个 数字 ? 通常 ，IP 地 址 的 长 度 
用 表示 它们 的 字 节 数 来 表示 。 在 这 个 例子 中 ， 每 个 数 占 8 个 字 节 ， 所 以 3 
个 数 占 24 个 字 节 。 


使 用 目的 卫 ， 路 由 将 消息 传递 给 具有 相同 前 绥 的 设备 组 。 这 个 组 被 


称 为 子 网 (subnet) 。 前 级 后 的 数字 提供 子 网 内 的 特定 主机 标识 符 
(host identifier) 。 例 如 ， 图 12-2 中 的 每 台 设备 都 在 子 网 
127.12.5.0/24 中 ， 主 机 ID 分 别 为 87、88 和 89。 在 邮件 系统 中 ， 我 们 可 以 
说 ， 所 有 共享 你 的 邮政 编码 的 房屋 都 在 你 的 “ 子 网 * 中 ， 而 你 的 街道 地 址 
则 是 你 的 “主机 标识 符 ”。 更 多 关于 子 网 、 前 级 和 主机 地 址 的 信息 ， 请 参 
考 本 书 网 站 Q12.2 和 Q12.1 部 分 。 


终端 用 户 设 备 通常 不 会 有 固定 的 静态 IP 地 址 。 通 常 ，IP 地 址 会 被 自 
动 分 配 并 租用 一 段 时 间 。 这 项 服务 由 动态 主机 配置 协议 (简称 DHCP) 
服务 器 提供 ， 向 设备 提供 相关 的 IP 地 址 信息 (图 12-3) 。DHCP 服 务 器 


跟踪 各 个 耳 地 址 自由 获得 的 信息 。 你 的 设备 与 它 联系 ， 就 会 获得 当前 未 
被 使 用 的 卫 地 址 有 限 的 租赁 时 间 。 当 租约 到 期 时 ， 可 以 续 约 ， 售 则 服务 
峰会 将 其 返还 到 地 址 池 ， 以 便 其 他 设备 使 用 。 
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图 12-3 


注 : 动态 主机 配置 协议 (DHCP) 服务 器 负责 将 互联 网 协议 〈IP) 地址 租赁 给 设备 。 
它 跟踪 本 地 数据 库 中 尚未 分 配 的 可 用 地 址 


有 时 ， 在 本 地 网 络 中 给 你 的 设备 分 配 的 IP 地 址 与 其 他 网 络 所 看 到 的 
不 同 。 例 如 ， 你 在 大 学 校园 内 的 笔记 本 电脑 地 址 可 能 与 外 部 世界 看 到 的 


不 同 。 网 络 地 址 转换 《简称 NAT) 路 由 霹 负 责 地 址 的 来 回转 换 ， 包 会 让 
本 地 之 外 的 人 们 可 以 根据 你 的 公共 IP 地 址 (图 12-4〉 对 你 的 设备 进行 寻 
址 。 你 可 以 把 NAT 看 成 公司 大 楼 里 的 收发 室 ， 当 一 个 包 于 要 被 投递 给 公 
司 里 的 茶 个 人 人， 邮递 系 统 根据 大 楼 的 地 址 《〈 即 公共 卫 ) 将 它 送 到 那里 。 
然后 ， 收 发 室 里 的 分 件 人 《 即 NAT 路 由 器 ) 根据 该 人 的 姓名 《 即 私 有 
IP〉 来 确定 将 其 放 进 谁 的 邮箱 ， 或 放 在 谁 的 加 上 。 
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图 12-4 


注 : 有 时 ， 你 的 公共 互联 网 协议 《IP) 地 址 与 私人 1P 地 址 不 同 。 网 络 地 址 转换 
CNAT) 路 由 器 负责 两 者 之 间 的 转换 


路 由 
正常 进行 寻 址 后 ， 下 一 步 是 决定 消息 到 达 目 的 地 所 选择 的 路 径 。 
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网 络 地 
私有 址 转换 。 公共 互联 网 
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10.0.25.13 


在 邮政 系统 中 ， 例 如 ， 从 新 泽 西 的 普林斯顿 到 佛罗里达 的 迈阿密 ， 
路 由 提前 决定 信件 将 经 过 哪些 中 间 城 市 。 信 件 从 普林斯顿 的 地 方 邮局 发 
出 ， 可 能 会 转移 到 新 泽 西 条 地 的 一 座 大 型 区 域 邮局 ， 然 后 转 到 佛罗里达 
某 地 的 一 座 大 型 邮局 ， 再 到 收 件 人 所 在 的 地 方 邮局 ， 最 后 送 到 收 件 人 的 
Ls 


在 互联 网 中 ， 消 息 使 用 的 路 径 会 有 所 不 同 ， 这 取决 于 它 所 使 用 的 路 
由 方法 。 有 两 类 方法 : 


在 自治 系统 (AS) 中 ， 使 用 基于 度量 的 (metric-based ) 
路 由 。 利 用 基于 度量 的 路 由 ， 目 标 通常 是 找到 最 短 或 最 不 拥挤 的 路 
径 ， 到 达 目 的 地 。 


。 在 自治 系统 之 间 ， 路 由 则 是 基于 策略 的 (policy-based) 。 
例如 ， 一 个 自治 系统 可 能 会 怀疑 另 一 个 系统 有 很 多 黑客 ， 并 希望 避 
免 将 数据 包 通 过 对 方 的 路 径路 由 。 


自治 系统 间 路 由 和 系统 内 路 由 非常 不 同 。 边 界 网 关 协 议 〈 简 称 
BGP) 是 不 同上 自治 系统 间 路 由 占 主 导 地 位 的 协议 ， 它 将 互联 网 条 在 一 
起 。 目 治 系统 内 有 两 种 主要 的 路 由 协议 : 


路 由 信息 协议 ， 简称 RIP， 其 中 每 个 路 由 器 收集 关于 自身 和 
其 他 路 由 器 之 间距 离 的 信息 ; 


开放 最 短路 径 优先 ， 简称 OSPF， 其 中 每 个 路 由 器 试图 建立 
整个 网 络 拓扑 结构 的 全 局 视图 。 


在 本 章 中 ， 我 们 将 介绍 RIP 背 后 的 主要 思想 ， 并 跳 过 最 常见 的 路 由 
类 型 OSPF 的 一 些 复杂 细节 。 


较 及 


回 到 我 们 的 例子 ， 从 新 泽 西 寄 一 封 信 到 佛罗里达 。 当 新 泽 西 的 邮局 
员工 收 到 信 后 ， 他 们 会 怎么 办 ? 他 们 会 看 信封 上 的 邮政 编码 ， 知 道 它 要 
到 佛罗里达 。 他 们 可 能 并 不 关心 具体 地 址 ， 比 如 哪个 城镇 或 城市 ， 只 知 
道 要 把 信 送 到 那个 州 的 茶 个 地 区 邮局 。 所 以 他 们 会 把 信 帮 到 一 架 飞 往 佛 


罗 里 达 的 飞机 上 。 然 后 ， 一 旦 信 到 达 那 里 ， 有 人 会 再 看 邮政 编码 ， 知 道 
要 把 它 送 到 迈阿密 。 所 以 他 们 会 把 它 放 到 开 往 那 儿 的 邮 车 里 。 最 后 ,一 
且 信 到 达 迈 阿 密 该 邮政 编码 和 履 盖 的 范围 内 ， 当 地 邮政 局 会 根据 上 面 的 地 
址 把 它 送 给 收 件 人 。 


在 互联 网 中 ， 每 次 路 由 器 接收 数据 包 时 ， 就 会 太 生 转发 
(forwarding) 行为 。 当 一 个 数据 包 到 达 后 ， 路 由 器 碍 看 写 在 数据 包 
里 的 目的 耳 地 址 ， 了 解 要 发 往 哪 里 ， 并 将 其 发 送 到 路 径 上 的 下 一 跳 。 然 
后 下 一 个 路 由 器 接收 数据 包 ， 碍 找 目的 地 ， 继 续 转 发 数据 包 ， 这 一 过 程 
以 这 种 逐 跳 的 方式 继续 。 这 是 一 个 无 连接 的 过 程 ， 正 如 我 们 在 第 11 章 讨 
论 模 块 化 时 谈 到 的 那样 。 


根据 目标 的 距离 ， 路 径 上 前 面 的 路 由 需 可 能 只 关心 地 址 的 前 缀 。 换 
句 话说 ， 它 们 首先 基于 目的 地 子 网 进行 转 及 ， 这 类 似 于 邮政 系统 首先 问 
目的 地 邮政 编码 转发 。 一 旦 数据 包 到 达 目 的 地 子 网 ， 后 面 的 路 由 器 将 根 
据 主 机 标识 符 转 发 到 特定 设备 上 。 


实际 情况 下 ， 转 发 如 何 发 生 ? 路 由 器 通过 链接 连接 到 网 络 中 的 其 他 
路 由 器 。 当 数据 包 到 达 输 入 链接 时 ， 路 由 器 将 它 转 移 到 传 出 链接 。 路 由 
器 内 置 硬 件 将 尽快 执行 此 功能 ， 迅 速 连接 起 管理 对 链接 访问 的 输入 和 和 输 
出 端口 。 


路 由 器 如 何 确定 ， 对 于 一 条 给 定 的 消息 哪个 是 正确 的 输出 链接 ”此 
言 息 保存 在 转发 表 (forwarding table) 中 ， 将 目标 卫 地 址 映射 到 输 
出 链接 ， 如 图 12-5 所 示 。 利 用 转发 表 ， 路 由 器 可 以 查看 目的 IP 地 址 ， 找 
到 和 它 在 表 中 的 条 目 ， 并 选择 相应 的 传 出 链接 ， 就 像 使 用 电话 短 ， 根 据 别 
人 的 名 字 碍 找 其 号 码 一 样 。 表 中 的 每 个 条 目 都 可 能 代表 很 大 范围 的 地 
址 ， 例 如 ， 图 12-5 中 ，10.1.2.1 和 10.1.2.10 都 可 以 到 达 链 接 3。 


图 12-5 


注 : 当 数 据 包 到 达 路 由 器 时 ， 路 由 器 将 在 其 转发 表 中 查找 目的 IP 地 址 ， 以 确定 将 数 
据 包 转发 到 哪个 输出 链接 

转发 表 需 要 建立 、 维 护 和 更 新 。 这 样 做 的 方式 取决 于 网 络 使 用 的 路 
由 方法 。 多 年 来 ， 许 多 不 同 的 方案 已 经 提出 。 接 下 来 ， 我 们 将 了 解 ， 通 
过 寻找 罕 过 网 络 的 最 短路 径 如 何 建立 这 些 表 。 


寻找 最 短路 径 


那么 ， 路 由 背后 的 总 体 目标 是 什么 ? 以 最 佳 方式 从 互联 网 上 的 一 点 
( 源 ) 到 达 另 一 点 《目的 地 ) 。 路 由 响 就 是 通过 网 络 传递 消 轧 的 中 间 节 


我 们 在 本 书 中 已 经 看 到 许多 不 同 的 图 表 ， 从 第 5 章 的 网 络 图 到 第 8 章 
和 第 10 章 的 社交 图 。 针 对 路 由 ， 我 们 现在 介绍 力 一 种 图 : 路 由 器 图 。 


路 由 右 图 


看 看 图 12_-6。 在 路 由 图 中 ， 源 的 工作 是 确定 转发 消息 到 哪个 近邻 
(在 这 里 是 A、B 或 C) 。 所 选择 的 节点 将 继续 转发 到 其 他 中 间 路 由 器 ， 
以 此 类 推 ， 直 到 消息 到 达 目 的 地 为 止 。 同 样 ， 转 发 是 以 一 次 一 跳 
(hop) 的 方式 进行 的 ， 其 中 一 跳 是 一 个 链接 。 


目的 地 


图 12-6 路 由 涉及 从 源 到 目的 地 的 流量 传输 

注 : 要 做 到 这 一 点 ， 每 个 节点 都 需要 知道 ， 对 于 转发 流量 到 某 个 目的 地 来 说 ， 哪 个 
近邻 最 合适 

从 源 到 目的 地 可 能 有 多 种 方法 。 我 们 如 何 确定 哪 条 路 径 是 最 好 的 ? 
通常 ， 我 们 想 要 选择 成 本 最 低 的 那 条 。 路 由 图 的 每 条 链接 表示 从 一 个 路 
由 器 到 男 一 个 的 实际 连接 ， 每 条 链接 都 有 与 其 相关 联 的 不 同 成 本 。 通 
常 ， 这 项 成 本 与 链接 连接 的 两 个 路 由 器 之 间 的 距离 有 关 。 例 如 ， 同 一 个 
房间 内 的 两 个 路 由 器 之 间 的 成 本 可 能 小 于 不 同 大 楼 里 两 个 路 由 器 之 间 的 


成 本 。 


我 们 应 该 用 什么 样 的 图 形 来 包 合成 本 ? 加 权 图 : 类 似 于 在 第 5 章 
中 ， 我 们 利用 重要 性 得 分 对 超 链 接 进 行 加 权 ， 我 们 利用 成 本 对 路 由 器 链 
接 加 权 。 在 图 12-6 中 ， 链 接 上 的 数字 表示 从 源 发 送 到 A 的 成 本 为 5， 而 
发 送 到 B 的 成 本 为 2。 此 外 ， 路 由 图 中 的 链接 是 有 回 的 : 如 果 从 A 可 以 转 
发 到 B， 这 并 不 意味 着 从 B 可 以 转发 到 A。 如 果 它 们 可 以 互相 转 友 ， 在 每 
个 方 同 上 的 成 本 也 不 一 定 相同 。 


寻找 从 一 个 节点 到 另 一 个 节点 成 本 最 小 的 路 径 ， 这 个 任务 是 图 论 中 
一 个 显而易见 的 问题 ， 它 称 为 最 短路 径 问 题 (shortest-path 
problem) ， 因 为 人 们 经 常 将 链接 的 成 本 作为 其 距离 。 当 链接 的 所 有 
权重 都 相等 时 ，“ 最 短路 径 ” 变 成 “最 少 跳 数 ”。 


你 可 以 在 图 12-7 中 看 到 一 个 最 短路 径 问题 的 简单 例子 ， 它 包含 4 台 
路 由 器 和 4 条 链接 。 如 果 A 想 发 送 到 D， 它 可 以 向 B 或 C 转 发 。 沿 路 径 
(A，B，D) 的 成 本 是 2 + 4 = 6， 沿 路 径 (A，C，D) 的 成 本 是 3+ 5 = 
8。 由 于 (A，B，D) 是 最 短路 径 ， 因 此 A 应 该 转发 到 B 然后 B 转 发 到 
D) 。 


tk 


图 12-7 


注 : 路 径 (A，B，D) 的 成 本 为 6， 路径 的 《A，C，D) 成 本 为 8。 如 果 A 要 发 送 到 D， 
它 应 该 转发 到 B，B 再 转发 到 D 


贝尔 受 - 福 特 算 法 


如 何 发 现 目 治 系统 中 路 由 器 之 间 的 最 短路 径 ? 具体 方式 需要 能 随 痢 
网 络 中 的 节点 和 链接 数量 扩展 ， 并 且 可 以 相对 迅速 地 根据 拓扑 结构 中 的 
变化 进行 调整 。 


自 20 世 纪 50 年 代 以 来 ， 最 短路 径 问 题 一 直 被 广泛 研究 。 一 些 著名 算 
法 被 开发 出 来 以 解决 该 问题 ， 如 贝尔 曼 - 福 特 、 迪 杰 斯 特 拉 以 及 A 星 搜 
索 ， 它 们 各 有 利 疯 。 在 本 章 中 ， 我 们 将 关注 贝尔 曼 - 福 特 算法 
(Bellman-Ford algorithm) ， 因 为 它 简 单 而 优雅 ， 并 前 述 了 路 由 算 
法 背后 的 基本 原理 。 它 也 带 来 一 些 著 名 路 由 协议 的 实施 ， 如 最 初 的 阿 帕 
网 。 


贝尔 曼 -福特 算法 得 名 于 美国 数学 家 理 查 德 :贝尔 曼 和 李斯 特 : 福 特 。 
他 们 分 别 于 1958 年 和 1956 年 发 布 该 算法 。 贝 尔 曼 为 人 熟知 ， 更 主要 是 因 
为 他 在 20 世 纪 50 年 代 引 入 动态 规划 (dynamic programming) 的 方 
法 ， 这 种 方法 将 数学 、 计 算 机 科学 、 经 济 学 等 学 科 的 复杂 问题 分 解 成 更 
小 、 更 简单 的 子 问 题 ， 使 其 更 容易 被 解决 〈 符 合 “ 分 而 治之 ”的 总 体 原 
则 ) ， 因 此 具有 重要 意义 。 动 态 规划 中 将 某 个 问题 与 其 子 问 题 建立 联系 
的 方程 ， 通 常 被 称 为 贝尔 曼 方程 。 


就 像 第 1 章 的 分 布 式 功率 控制 ， 贝 尔 曼 -福特 算法 是 一 个 不 断 重 复 的 
迭代 过 程 ， 直 到 我 们 可 以 确定 它 已 经 完成 。 在 每 次 迭代 中 ， 它 都 会 找到 
一 条 从 源 到 目的 地 的 最 短路 径 ， 然 后 在 下 一 次 友 代 中 使 用 这 些 信息 ， 看 
它 是 否 能 找到 一 条 更 短 的 路 人 笃 。 第 一 步 只 使 用 一 跳 ， 找 到 一 个 最 短路 
径 ， 第 二 步 最 多 使 用 两 跳 ， 第 三 步 最 多 三 跳 ， 以 此 类 推 。 使 用 更 多 跳 数 
增加 了 更 多 可 能 性 ， 因 此 伴随 每 次 迭代 ， 成 本 将 减少 (或 保持 不 变 ) 。 


让 我 们 以 图 12-8 中 的 路 由 器 图 为 例 ， 来 说 明 贝 尔 曼 -福特 算法 。 图 
中 有 6 台 路 由 器 A 人 至 F， 链 接 成 本 如 图 所 示 。 路 由 器 A 人 至 E 的 目标 是 ， 找 出 
它们 到 达 目 的 地 F 的 最 低 成 本 路 径 。 


图 12-8 包含 六 台 路 由 器 的 示例 图 


注 : 链接 成 本 已 标 出 
第 一 步 


对 于 第 一 步 ， 我 们 只 需要 知道 ， 哪 些 节 点 有 一 跳 路 径 《〈 即 一 个 链 
接 ) 到 F， 哪 些 没有 。A、B 和 C 不 能 通过 一 跳 到 那里 ， 因 为 它们 都 没有 
直接 链接 到 FE， 但 D 和 E 可 以 : 它们 的 直接 链接 成 本 分 别 为 8 和 10。 因 
此 ， 一 跳 的 最 短路 径 和 相关 成 本 为 : 


D: 路 径 = (D，F) ， 成 本 = 8 
E: 路 径 = (E，F) ， 成 本 = 10 


图 12-9 总 结 了 第 一 步 ， 其 中 链接 突出 显示 ， 并 标 出 到 F 的 成 本 。 


(10) 
图 12-9 单 跳 的 最 短路 径 和 成 本 

注 : D 和 E 都 可 以 通过 一 跳 到 达 F， 而 A、B 和 C 不 能 

第 二 步 

进行 到 第 二 步 ， 要 问 的 问题 是 :从 每 个 节点 最 多 使 用 两 跳 ， 到 F 的 
最 短路 径 是 什么 ? 贝尔 受 -福特 算法 使 用 第 一 步 的 信息 来 回答 。 毕 葛 ， 
如 果 某 个 布点 有 一 个 可 转发 的 近邻 ， 可 以 通过 一 跳 到 达 F， 那 么 这 个 贡 
扩 必 须 能 够 通过 该 邻居 ， 在 两 跳 后 到 达 F。 要 确定 这 个 路 人 径 的 总 成 本 ， 
我 们 可 以 把 该 市 把 到 达 近 邻 的 成 本 ,添加 到 该 近邻 到 达 目 的 地 的 成 本 
es 


让 我 们 从 A 开 始 。 它 有 3 个 传 出 近邻 : B、C 和 D。B 和 C 都 不 能 在 一 
跳 后 到 达 F， 所 以 它们 现在 没有 帮助 。 与 此 相反 ，D 可 以 在 一 跳 后 到 达 
FE， 成 本 为 8， 而 A 一 开始 转发 到 D 的 成 本 为 6。 因 此 ，A 可 通过 路 径 
(A，D，F) ， 在 两 跳 后 到 达 F， 成 本 为 6 + 8 = 14。 这 是 A 到 达 F 最 短 
(也 是 唯一 ) 的 两 跳 路 径 。 


B 怎 么 样 ? 它 有 2 个 传 出 近邻 : C 和 E。C 不 能 在 第 一 步 后 到 达 FE， 但 
E 可 以 到 那里 ， 成 本 为 10。 由 于 B 转 发 到 E 的 成 本 为 4， 因 此 B 可 以 通过 路 
径 (B，E，F) ， 在 两 跳 后 到 达 F， 成 本 为 4+ 10 = 14。 


现在 到 C， 它 有 2 个 传 出 近邻 : D 和 E。 它 们 都 能 够 在 第 一 步 后 到 达 


由 于 D 到 目的 地 的 成 本 是 8， 因 此 通过 D 的 总 成 本 是 2 + 8 = 


。 由 于 E 到 F 的 成 本 是 10， 因 此 总 成 本 是 3 + 10 = 13。 


由 于 10 比 13“ 更 短 ”， 因 此 C 将 选择 〈C，D，F) 作为 其 到 达 F 的 两 跳 
路 径 。 


D 怎 么 样 ? 这 个 市 点 有 2 个 传 出 的 近邻 ,A 和 F。A 不 能 在 一 跳 后 到 
达 F， 所 以 直接 转发 到 F 仍 然 是 其 唯一 的 选择 。 实 际 上 ， 在 这 样 的 情况 
下 ， 路 由 器 可 以 直接 转发 到 目的 地 ， 它 会 发 送 到 其 他 地 方 吗 ? 也 许 会 。 
记 住 ， 最 短路 径 问 题 是 考虑 最 小 成 本 ， 而 不 是 最 小 跳 数 。 有 可 能 出 现 有 
中 间 环 节 但 总 成 本 较 低 的 情况 。 


现在 ， 让 我 们 考虑 E。D 和 F 是 它 的 两 个 传 出 近邻 : 


。 直接 转发 到 F 的 成 本 为 10。 
。D 到 达 F 的 成 本 为 8， 总 成 本 略 低 ， 为 1+8 = 9。 


所 以 ，E 将 选择 (E，D，F) 。 


总 结 ， 第 二 步 之 后 发 现 的 路 径 是 : 


: 路 径 = (A，D，F) ， 成 本 = 14 
: 路 径 = (B，E，F) ,成 本 = 14 
路 径 = (0，D，F) ， 成 本 = 10 
: 路 径 = (D，F) ， 成 本 =8 

: 路 径 = (E，D，F) ,成 本 = 9 
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如 图 12-10 所 示 。 与 图 12-9 相 比 ，A、B 和 C 现 在 都 可 以 到 达 目 的 
地 ， 并 且 下 选择 的 路 径 已 经 改变 。 


(14) 6 
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图 12-10 两 跳 的 最 短路 径 和 成 本 
注 : 现在 所 有 节点 都 可 以 到 达 F。B 仍 然 认 为 通过 E 的 总 成 本 是 14， 因 为 它 还 没有 来 自 
第 二 步 的 更 新 成 本 
让 我 们 花 一 点 儿 时 间 分 析 贝 尔 曼 -福特 算法 为 发 现 最 短路 径 所 做 的 
工作 。 在 每 一 步 ， 路 由 器 看 着 每 个 传 出 近邻 ， 目 言 自 语 :“ 我 转发 到 你 
的 成 本 是 w， 而 你 到 达 目 的 地 的 成 本 是 x， 那 么 ， 如 果 我 通过 你 转 及 ， 再 
经 过 一 跳 ， 到 达 目 的 地 的 成 本 将 是 w + x。?” 路 由 器 会 选择 所 有 近邻 之 间 


最 低 的 总 成 本 。 你 可 以 在 图 12-11 中 看 到 这 个 理念 。 源 《S) 有 两 个 传 出 
近邻 ，A 和 B。A 可 以 在 比如 六 跳 后 到 达 目 的 地 〈D) ， 成 本 为 x， 而 链 
接 (S，A) 的 成 本 是 w。 因 此 ，S 可 以 通过 A， 在 七 跳 后 到 达 目 的 地 ， 
成 本 为 w + x。B 的 情况 类 似 ， 成 本 将 是 y + z。 这 些 成 本 中 较 低 的 一 个 ， 
就 是 S 将 在 这 一 步 选 择 的 。 


图 12-11 
注 : 在 贝尔 有 曼 - 福特 算法 中 的 每 一 步 ， 源 检查 其 传 出 近邻 ， 看 哪 一 个 提供 到 达 目 的 


地 的 最 低 总 成 本 。 要 做 到 这 一 点 ， 它 必须 知道 两 点 : 到 达 其 近邻 的 成 本 〈 这 里 是 w 和 
y) 和 从 每 个 近邻 到 目的 地 的 总 成 本 〈 这 里 是 x 和 z) 。 

第 三 步 

现在 进行 了 三 跳 ，A 是 什么 情况 ? 它 的 三 个 近邻 可 以 在 最 多 两 跳 后 
到 达 目 的 地 : 


。B 到 F 的 成 本 是 14， 所 以 通过 B 的 总 成 本 是 4 + 14 = 18。 
。C 的 成 本 是 10， 所 以 总 成 本 是 2 + 10 = 12。 
。D 到 目的 地 的 成 本 是 8， 所 以 总 成 本 是 6 + 8 = 14。 


由 于 转发 到 C 带 来 最 低 成 本 12， 因 此 A 将 选择 (A，C，D，F) 。 


B 怎 么 样 ? B 既 可 以 转发 到 C， 


总 成 本 为 5 + 10 = 15， 也 可 以 转发 到 


E， 成 本 为 4 + 9 = 13。B 将 继续 选择 E，B 的 路 径 现 在 会 反映 E 在 第 二 步 


的 变化 。 


你 会 及 现 C、D 和 E 的 路 径 跟 上 次 相 比 不 会 改变 。 在 这 一 点 上 发 现 的 


路 径 是 : 
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: 路 径 = 
: 路 径 = 
: 路 径 = 
: 路 径 = 


: 路 径 = 


(A, 
(B, 
(C, 
(D, 
(E, 


F) 
D， 


D，F) ， 成 本 = 
D，F) ， 成 本 = 
F) ， 成 本 = 10 
， 成 本 = 8 

F) ， 成 本 = 9 


结果 在 图 12-12 中 突出 显示 。 


5 (9) 
图 12-12 三 跳 的 最 短路 径 和 成 本 
第 四 步 、 第 五 步 ..………. 


实际 上 没有 必要 继续 四 、 五 或 更 多 跳 数 ， 因 为 在 这 个 例子 中 ， 该 算 
法 已 经 确定 了 最 短路 径 。 总 的 来 说 ， 贝 尔 曼 - 福 特 算法 可 能 需要 进行 图 
中 节点 的 数目 ， 然 后 你 才 可 以 确定 它 已 经 完成 。 更 多 关于 这 方面 的 信 
息 ， 请 参考 本 书 网 站 Q12.3 部 分 。 


即便 如 此 ， 在 自治 系统 路 由 的 真实 情景 中 ， 我 们 刚 开 始 通 常 不 知道 
有 多 少 个 节点 。 相 反 ， 友 代 最 短路 径 算 法 必须 依赖 每 一 步 发 现 的 最 短路 
径 的 变化 ， 以 确定 什么 时 候 俘 止 运 行 是 安全 的 。 不 过 停止 只 能 是 暂时 
的 : 网 络 结构 可 能 会 随时 间 而 改变 ， 影 响 链 接 成 本 、 节 点 数 ， 或 两 者 都 
影响 ， 进 而 影响 在 任何 给 定点 的 最 短路 径 。 该 算法 需要 定期 运行 ， 以 保 
持 其 路 径 -成 本 计算 不 断 更 新 。 


传递 消 居 以 友 现 最 短路 径 


互联 网 上 的 路 由 通过 转发 实现 ， 一 次 发 生 一 跳 。 每 个 路 由 器 的 转发 
表 只 包含 消息 下 一 步 应 该 发 送 到 哪里 的 信息 ， 如 图 12-5 所 示 。 在 我 们 的 
例子 〈 图 12-12) 中 ， 当 消息 到 达 路 由 器 A， 目 的 地 为 F 时 ，A 只 需要 知 
道 它 应 该 转发 到 C。 它 不 必 关 心 消息 在 此 之 后 将 选择 什么 路 径 。 同 样 ， 
B 只 知道 转发 到 E，C 转 发 到 D，D 转 发 到 FE，E 转 发 到 D。 这 真是 个 相当 
惊人 的 分 布 式 路 由 特性 ! 


在 实践 中 ， 创 建 转发 表 需 要 一 个 额外 的 重要 步 又 。 该 表 需 要 考虑 每 
个 路 由 器 只 有 网 络 的 本 地 视图 ， 这 意味 着 它 只 知道 其 近邻 的 存在 和 路 

径 - 成 本 信息 。 最 短路 径 需 要 以 分 布 式 被 发 现 ， 每 个 路 由 器 都 需要 根据 
本 地 信息 构建 转发 表 。 


如 何 做 到 这 一 点 ? 通过 消息 传递 。 路 由 器 必须 发 送 消息 给 近邻 ， 表 
明 其 发 现 的 路 径 - 成 本 信息 ， 并 基于 得 到 的 消 轧 ， 不 断 更 新 自己 的 表 。 
每 条 消息 都 简短 总 结 路 由 器 可 以 到 达 的 所 有 目的 地 ， 以 及 到 达 每 个 目的 
地 的 路 径 的 总 成 本 。 


消息 传递 是 本 地 完成 的 ， 从 近邻 到 近邻 。 通 过 这 个 过 程 ， 路 由 器 可 
以 得 到 所 有 它们 需要 的 关于 端 到 端 最 短路 径 的 信息 ， 但 它 无 须知 道 这 些 
路 径 是 什么 。 对 于 图 12-12 中 我 们 的 示例 网 络 ， 消 息 传 递 几 步 后 ，A 就 
知道 它 到 F 的 最 短路 径 是 通过 C。 它 不 知道 C 会 继续 转发 到 D(C 也 不 知 
道 D 会 转发 到 F) ， 同 时 出 于 在 网 上 转发 的 目的 ， 它 也 不 需要 知道 。 


贝尔 曼 -福特 算法 结合 消息 传递 的 一 个 应 用 ， 是 之 前 提 到 的 自治 系 
统 内 路 由 协议 RIP 的 实施 。 作 为 最 早 的 方法 之 一 ， 如 今 它 仍然 在 使 用 ， 
而 路 由 器 之 间 的 一 跳 消 息 传 递 使 其 相当 容易 实现 。 我 们 提 到 的 另 一 个 自 
治 系统 内 协议 OSPF 时 ， 已 经 在 过 去 几 十 年 里 获得 很 大 的 知名 度 。RIP 只 
保留 关于 近邻 的 信息 ， 而 利用 OSPF 时 ， 每 个 路 由 器 都 会 试图 构建 网 络 


的 本 地 视图 ， 包 括 每 条 链接 的 状态 (如 成 本 ) 。 结 果 ，OSPF 是 一 种 链 

路 状态 (link-state) 路 由 ， 而 RIP 是 距离 向 量 (distance-vector) 路 
由 。OSPF 尤 其 适合 在 大 型 网 络 中 优先 使 用 ， 其 中 的 链接 状况 可 能 会 很 

快 改变 。 


路 由 器 传递 消息 以 建立 转发 表 ， 和 是 网 络 分 布 式 算法 和 协调 的 另 一 个 
例子 ， 也 是 本 书 的 重要 主题 之 一 。 当 网 络 随 着 时 间 推 移 进 行 扩展 和 变化 
时 ， 它 将 可 扩展 管理 考虑 在 内 。 第 一 部 分 的 功率 控制 和 载波 传 感 是 我 们 
己 经 看 到 的 其 他 分 布 式 程序 ， 而 我 们 在 第 13 章 讨论 拥塞 控制 时 ， 还 将 看 
到 男 一 种 。 记 住 ， 这 些 算法 的 运行 ， 可 能 会 与 我 们 在 第 二 和 第 三 部 分 讨 
论 的 排名 和 推荐 程序 的 集中 性 质 形 成 对 比 。 


第 五 部 分 
局 红 : 


/AN 二 口 


互联 网 是 一 个 不 断 扩大 的 网 络 之 网 络 ， 通 过 分 而 治之 的 原则 ， 能 
在 功能 和 地 理 上 保持 可 扩展 性 。 我 们 刚才 看 到 其 设计 背后 的 三 个 基本 
概念 : 分 组 交换 ， 对 资源 进行 共享 而 不 是 专用 ; 分 布 式 层次 结构 ， 在 
地 理 上 将 控制 分 散 到 网 络 的 不 同 部 分 ; 模块 化 ， 将 任务 分 为 不 同 功 能 


层 并 分 别管 理 。 我 们 还 详细 介绍 了 路 由 ， 这 是 在 互联 网 上 从 一 地 到 另 
一 地 传输 流量 的 重要 任务 。 它 也 以 可 扩展 的 方式 进行 ， 通 过 路 由 器 之 
间 的 分 布 式 消息 传递 发 现 最 短路 径 ， 同 时 也 是 网 络 中 分 布 式 算 法 和 协 
调 的 另 一 个 例子 。 


与 多 们 特 ' 卡 恩 的 对 话 


罗伯特 : 卡 恩 被 公认 为 “互联 网 之 父 ” 之 一 。 他 和 温 顿 : 琴 夫 共同 发 明 
了 TCP/IP。 


作者 : 鲍 勃 “罗伯特 ) ， 要 是 没有 TCP/IP， 你 认为 互联 网 能 有 今天 
吗 ? 


鲍 勃 : 我 认为 TCP/IP 是 一 门 通用 语 。 这 是 一 组 协议 和 程序 ， 使 组 成 
互联 网 的 不 同 组 件 能 够 连接 在 一 起 。 那 么 ， 可 以 有 一 套 不 同 的 协议 和 程 
序 ， 使 之 成 为 可 能 吗 ? 是 的 。 我 猜测 ， 为 了 取得 同样 的 建构 稳健 性 ， 你 
可 能 需要 某 些 相当 接近 我 们 以 前 在 TCP/P 中 做 的 东西 ， 但 它 可 能 会 有 些 
不 同 。 你 需要 这 样 的 东西 ， 让 各 部 分 组 合 到 一 起 ， 和 否则 你 会 遇 到 端 到 端 
的 互相 连通 性 问题 ， 其 中 所 有 接口 都 可 能 非常 不 同 。 所 以 我 想 ， 如 果 没 
有 温 顿 : 瑟 夫 和 我 发 明 的 协议 ， 或 与 之 十 分 类 似 的 东西 ， 可 能 不 会 有 今 
天 的 互联 网 。 


作者 : 但 是 回头 看 ， 我 们 之 前 并 不 总 是 很 清楚 ， 那 就 是 我 们 的 前 进 
方向 。 你 认为 ， 在 过 去 40 年 中 ， 是 什么 让 TCP/IP 以 可 互 操作 的 方式 ， 最 
终 将 网 络 的 每 一 个 部 分 凝聚 在 一 起 ? 


鲍 勃 : 喝 ， 在 过 去 40 年 中 ， 这 个 世界 真 的 已 经 改变 了 很 多 ， 甚 至 关 
于 互联 网 组 成 部 分 的 基本 概念 都 改变 了 一 些 ， 但 是 ， 人 们 对 互联 互通 有 
基本 需要 。 早 在 20 世 纪 70 年 代 初 期 ， 在 我 们 做 这 项 工作 时 ， 其 实 没有 太 
多 其 他 选择 。 欧 洲 人 最 终 决 定 采 取 类 似 行动 ， 他 们 集中 于 一 个 和 我 们 几 
乎 相同 的 IP 方 法 ， 并 最 终 与 我 们 合并 ， 双 方 开 始末 用 相同 的 基本 IP 战 
略 ， 并 有 多 种 终端 到 终端 的 协议 。 我 想 ， 欧 洲 人 把 他 们 的 叫 作 TP0、 


TP2 和 TP4， 最 终 它 们 没有 占据 一 席 之 地 ， 因 为 在 此 之 前 ， 太 多 国家 已 
经 采用 了 TCP。 


我 认为 这 更 多 是 建立 临界 质量 的 问题 ， 因 为 互联 网 的 发 展 是 渐进 
的 。 人 们 想 做 的 是 ， 将 他 们 可 以 互动 的 一 群 参与 者 连接 起 来 ， 在 还 有 有 零 
星 不 同 选 择 的 时 候 ， 其 中 的 大 多 数 人 束 基 本 上 都 采用 了 TCP/IP。 甚 至 当 
国际 标准 提出 后 ， 也 没有 人 愿意 花 时 间 和 精力 去 转换 ， 因 为 这 样 做 没有 
成 本 效益 。 


作者 : 在 1974 年 年 初 ，TCP/IP 其 实 是 一 个 协议 ， 之 后 才 被 分 成 两 
层 。 你 如 何 描述 这 个 从 一 个 协议 演变 为 两 层 的 过 程 ? 


鲍 勃 : 喝 ， 人 们 感受 到 的 问题 其 实 是 受 实 时 通信 需要 的 驱动 。 第 一 
个 立即 可 用 的 产品 ， 是 我 在 美国 国防 部 高 级 研究 计划 着 时 开始 开发 的 分 
组 语音 程序 。 这 里 的 想法 是 ， 你 可 以 选取 模拟 语音 流 ， 将 其 数字 化 ， 分 
切 成 碎片 〈“ 即 我 们 所 说 的 “ 包 训 ”) ， 并 将 其 分 别 发 送 〈 或 分 组 ， 或 通过 
网 络 以 某 种 方式 将 其 量化 )， 使 其 成 为 更 大 的 聚合 ， 同 时 能 够 在 数字 化 
声音 的 另 一 端 重建 一 个 连续 语音 流 。 这 就 是 问题 ， 我 们 证 明了 这 是 有 可 
能 做 到 的 。 


现在 ， 在 原始 的 阿 则 网 协议 中 使 用 TCP 时 ， 每 次 有 消息 通过 ， 你 要 
先进 行 确认 ， 然 后 才能 发 送 下 一 条 消息 ， 所 以 这 可 能 会 产生 延迟 。 这 样 
的 网 络 效应 是 ， 语 音 可 能 出 现 中 断 。 我 们 在 BBN (技术 公司 ) 的 帮助 
下 ， 通 过 引入 一 种 不 需要 确认 的 新 型 数据 包 ， 解 决 了 这 一 问题 。 我 们 在 
阿 由 网 中 称 之 为 三 型 数据 包 。 


但 是 当 我 们 来 到 事物 的 互联 网 方面 ， 端 到 端的 协议 是 TCP 协 议 ， 它 
将 IP 捆 绑 在 里 面 ， 所 以 它 是 复合 的 。 我 的 想法 是 ， 应 用 程序 会 和 TCP 程 
序 沟 通 ， 解 释 它 的 需要 。 所 以 ， 比 如 说 ， 如 果 对 方 是 语音 应 用 程序 ， 这 
个 应 用 程序 会 说 : “在 数据 包 到 达 时 发 送 给 我 ， 但 如 果 它 们 晚 到 比如 
20、40 或 60 坚 秒 的 话 ， 就 不 用 费心 给 我 发 送 任何 数据 包 了 。 我 将 不 会 再 


想 处 理 它们 ， 因 为 使 用 它们 已 经 太 晚 了 。” 我 的 想法 是 ，TCP/IP 程 序 可 
以 决定 将 什么 传 给 程序 ， 这 取决 于 它 的 需求 。 事 实证 明 ， 要 让 每 一 个 已 
经 建立 的 应 用 程序 都 能 重新 编码 ， 能 够 解释 它 的 需求 是 什么 ， 然 后 使 

TCP 程 序 可 以 接受 来 自 所 有 这 些 程序 的 输入 ， 这 真 的 太 难 了 。 因 此 ， 一 
个 更 简单 的 选择 是 ， 将 其 分 成 一 个 只 有 端 到 端的 部 分 ， 以 及 一 个 不 可 靠 
的 传输 部 分 ， 这 样 它 会 在 数据 包 到 达 后 就 进行 传输 ， 让 端 到 端的 部 分 弄 
清楚 ， 如 何 把 它们 以 某 种 形式 重新 组 合 在 一 起 。 


这 就 是 导致 两 者 分 裂 的 原因 。 人 们 意识 到 需要 这 样 做 ， 我 想 很 多 人 
没有 认识 到 还 有 其 他 选择 。 但 现在 看 来 ， 我 认为 我 当时 提出 的 是 一 个 更 
好 的 长 期 战略 ， 但 它 不 是 一 个 非常 可 行 的 短期 保 略 。 这 如 是 我 们 选择 卫 
的 原因 ， 我 在 最 后 的 分 析 中 必须 同意 大 家 。 


作者 : 那 真 是 一 段 非常 有 趣 的 历史 。 对 于 路 由 部 分 ， 我 想 知道 你 是 
含有 你 最 喜欢 的 类 比 ， 用 来 同 别 人 解释 网 络 上 的 路 由 是 如 何 工 作 的 。 


鲍 勃 : 我 更 倾 问 于 解释 路 由 表 是 如 何 工 作 的 。 也 就 是 说 ， 某 些 东西 
会 从 一 条 线路 进入 一 个 节点 。 这 个 节点 可 能 是 一 个 分 组 交换 机 ， 或 者 是 
一 个 网 络 之 间 的 网 关 。 你 经 过 奉 找 ， 从 传 入 数据 包 中 找 出 它 的 传 出 方 
回 ， 看 表 中 说 要 问 哪 条 输出 线路 输出 ， 然 后 把 它 放 在 那 条 线路 上 。 表 基 
本 上 从 近邻 的 更 新 得 到 递增 。 基 本 上 ， 特 定 的 交换 机 或 网 关 诀 定 谁 最 接 
近 最 终 目的 地 ， 然 后 会 试图 发 送 到 那里 。 你 可 能 有 更 全 面 的 表 ， 全 局 表 
代表 全 网 (如 果 你 知道 整个 拓扑 的 话 )， 然 后 你 就 可 以 对 如 何 按 路 线 友 
送 做 出 优化 决策 。 或 者 你 可 能 有 不 同 线路 上 的 流量 信息 ， 试 图 将 其 发 送 
到 最 不 拥堵 的 路 径 ， 而 不 仅仅 是 最 近 的 连接 。 


如 果 我 要 答 试 描述 路 由 如 何 工作 ， 这 融 是 我 要 做 的 。 但 是 这 充满 变 
数 ， 并 且 根 据 情 况 变 化 ， 你 不 一 定 能 事先 选择 好 所 有 路 线 ， 并 坚持 那 
个 “成 略 >”， 尽 管 你 可 以 这 样 做 。 


作者 : 如 果 你 可 以 回 到 比如 说 1974 年 ， 你 会 做 些 什 么 不 同 的 或 额外 


的 事 ? 


鲍 勃 : 我 们 所 采取 的 大 部 分 措施 都 是 非常 明显 的 渐进 步骤 ， 除 了 我 
们 必须 发 明 的 整体 网 络 架构 。 如 何 让 这 些 东西 一 起 工作 ? 因此 ， 我 们 必 
须 创 造 耻 地 址 的 概念 ， 我 们 必须 创造 网 关 或 路 由 器 的 概念 ， 以 及 沟通 流 
量 的 通信 协议 等 ， 还 有 许多 中 间 的 东西 ， 如 网 关 - 网 关 协 议 ， 如 何 显 示 
路 由 或 边界 网 关 协 议 ， 等 等 。 


我 可 以 告诉 你 我 希望 会 更 好 的 事情 。 我 希望 ， 我 们 早期 在 安全 方面 
取得 更 大 进步 。 但 请 记 住 ， 我 们 确实 试图 做 到 这 一 点 。 我 们 并 不 是 忽略 
了 它 ， 虽 然 很 多 人 这 样 认为 。 但 与 此 相反 ， 为 了 真正 在 互联 网 上 获得 有 
意义 的 安全 ， 我 们 必须 让 该 领域 一 些 有 专长 的 人 与 我 们 合作 。 他 们 甚至 
不 确定 这 项 技术 将 会 是 有 用 的 ， 或 者 会 产生 某 些 结 末 。 当 时 它 根 本 没有 
商业 化 。 他 们 有 很 多 事情 要 操心 ， 实 在 没有 时 间或 精力 来 关注 这 个 。 所 
以 我 们 采取 了 一 些小 的 增 量 步骤 ， 你 可 以 在 互联 网 上 搜索 和 了 解 这 一 
点 。 我 们 创造 了 最 初 的 私人 线路 接口 ， 但 它们 基本 上 是 红色 和 黑色 的 处 
理 促 ， 连 接着 中 间 的 加 密 设 备 。 事 实 上 我 们 对 它们 进行 了 测试 ， 并 且 有 
办 法 规避 加 密 ， 以 进行 选择 性 寻 址 。 我 想 我 们 最 初 是 用 一 个 站 点 进行 测 
试 ， 然 后 用 32 个 站 后 测试 。 所 以 有 增 量 的 改进 ， 但 我 希望 我 们 当时 能 做 
得 更 好 。 


第 二 件 我 们 刚 开 始 时 不 满意 、 体 系 结构 允许 的 事 ， 是 我 们 假设 还 有 
很 多 不 同 的 能 力 ， 并 假设 网 络 数量 会 很 小 。 那 时 的 网 络 都 很 大 ， 一 般 都 
像 阿 帕 网 、AT&T 网 络 或 防御 网 ， 或 者 是 某 种 广域网 那样 。 我 们 假设 会 
有 少数 几 个 ， 也 许 全 世界 有 4、8、16 个 ， 但 很 快 就 有 数 以 千 计 以 太 网 这 
样 的 网 络 出 现 。 这 一 切 的 网 络 效应 是 ， 我 们 最 初 的 寻 址 工作 假设 有 32 位 
的 地 址 空间 ， 我 们 给 网 络 分 配 8 位 ， 给 网 络 上 的 终端 机 器 分 配 24 位 ， 但 
这 很 快 就 被 最 新 的 发 展 追 赶 上 。 因 此 ， 我 们 最 终 在 实时 处 理 中 ， 不 得 不 
重新 开发 应 对 方法 。 我 想 ， 如 果 我 们 之 前 了 解 它 会 有 多 大 影响 ， 就 应 该 
早点 儿 着 手 ， 开 发 比如 128 位 或 256 位 的 地 址 ， 也 就 不 必 经 历 所 谓 IPv4 癌 


IPv6 过 渡 的 痛 兰 。 


多 年 来 ， 我 一 直 在 研究 如 何 围绕 管理 信息 的 概念 重 塑 互 联网 ， 而 不 
仅仅 是 移动 数据 字 节 。 我 一 二 在 研究 所 谓 的 数字 对 象 框 采 ， 这 在 全 球 都 
得 到 了 推动 。 但 美国 并 没有 大 力 发 展 它 ， 因 为 人 们 的 关注 点 都 在 网 络 
上 ， 而 在 全 球 范 围 内 ， 人 们 对 这 一 领域 的 兴趣 非常 大 。 如 果 我 早 就 想到 
它 ， 那 在 40 年 前 我 融会 这 样 做 的 。 


作者 : 你 能 描述 一 下 数字 对 象 框架 吗 ? 


鲍 勃 : 我 们 在 这 个 框架 中 所 做 的 ， 是 从 这 一 概念 入 手 : 我 们 处 理 的 
每 个 东西 部 是 数字 对 象 ， 而 数字 对 象 要 么 是 一 个 比特 序列 ， 要 么 是 一 组 
比特 序列 ， 并 且 有 唯一 的 持久 标识 符 。 如 果 你 在 谈论 信息 ， 这 些 信息 可 
以 是 数字 对 象 的 形式 ， 但 是 你 也 可 以 拥有 代表 个 人 的 数字 对 象 。 事 实 
上 ， 如 果 你 解析 了 这 个 对 象 ， 你 不 会 得 到 一 个 人 ， 但 会 得 到 有 关 这 个 人 
的 信息 ， 如 他 们 的 公共 密 钥 ， 或 茶 天 可 以 在 哪里 联系 他 们 ， 或 任何 其 他 
他 们 想 让 你 知道 的 事 ， 甚 至 是 他 们 的 电子 邮件 地 址 等 。 因 此 ， 我 们 假 
设 ， 在 网 络 环境 中 ， 你 关心 的 每 一 个 资源 都 有 它 目 己 的 特性 。 因 此 ， 如 
果 你 试图 与 某 个 东西 进行 连接 ， 你 可 以 通过 使 用 公共 密 钥 来 进行 挑战 
应答) 交互 ， 发 现 你 所 连接 的 对 象 。 因 此 ， 数 字 对 象 有 唯一 的 持久 标 
识 符 ， 我 们 正好 称 它 们 为 句柄 ， 但 它们 确实 是 你 所 谈论 的 清晰 标识 符 。 


例如 ， 在 今天 的 世界 上 ， 比 方 说 ， 如 果 你 使 用 一 个 URL 访 问 某 台 机 
器 上 的 文件 ， 同 时 想 将 其 保存 下 来 ， 也 许 那 是 政府 信息 或 者 企业 信息 。 
100 年 后 ， 你 希望 能 回来 获得 这 些 信息 ， 但 很 可 能 这 个 URL 已 经 没 用 
了 。 这 台 机 器 已 经 消失 ， 公 司 名 称 可 能 已 经 更 改 ， 或 者 信息 可 能 不 在 那 
个 文件 中 。 但 如 果 你 给 这 条 信息 一 个 唯一 的 标识 符 ， 那 么 无 论文 件 在 哪 
里 ， 只 要 有 人 得 到 它 ， 你 就 能 将 这 个 标识 符 解 析 为 信息 ， 我 称 之 为 状态 


x 
言 息 。 


我 肯定 你 读 过 IEEE 汇 刊 或 ACM 期 刊 ， 或 任何 传统 科学 期 刊 。 在 今 


天 的 科学 文献 中 ， 大 家 都 在 使 用 这 个 系统 ， 它 们 全 都 使 用 这 个 框架 。 我 
们 称 之 为 句柄 系统 ， 它 有 能 力 存 储 被 识别 对 象 的 状态 信息 ， 这 样 你 就 可 
以 重新 获得 它 。 如 果 它 是 可 用 的 ， 它 可 以 告诉 你 应 该 去 哪里 访问 。 你 可 
以 移动 对 象 。 它 可 以 在 印刷 的 引用 资料 中 ， 也 可 以 存在 于 电子 存储 系统 
中 ， 但 即使 你 移动 信息 或 改变 后 层 技术 基础 ， 也 必须 回去 改变 标识 符 。 
如 果 有 人 这 样 做 ， 标 识 符 束 会 把 你 带 到 那里 。 当 然 ， 你 必须 得 到 允许 才 
能 去 访问 它 。 可 能 需要 付费 ， 可 能 会 有 防火 增 阻 止 你 获取 茶 些 信 息 ， 但 
原则 上 ， 框 架 是 允许 这 样 做 的 。 


这 个 框架 有 三 个 组 成 部 分 。 一 是 我 谈 到 的 解析 系统 ， 我 们 称 其 为 句 
柄 系统 。 它 获取 一 个 标识 符 ， 并 将 被 识别 事物 的 状态 信息 返回 给 你 。 第 
二 ， 存 储 库 技术 可 以 让 你 存储 数字 对 象 ， 并 完全 基于 其 标识 符 访问 它 
们 ， 这 样 它 们 可 以 被 存储 于 后 台 的 任何 地 方 ， 如 U 盘 、RAID 阵 列 或 只 是 
云 服务 中 《任何 你 想 用 来 存储 的 方法 都 可 以 ) 。 而 且 这 一 切 都 是 用 户 看 
不 见 的 ， 因 为 它 藏 在 存储 库 背 后 。 最 后 ， 我 们 称 为 DO 存储 库 和 DO 广 册 
表 的 注册 表 一 般 存储 对 象 的 元 数据 ， 它 允许 你 浏览 或 搜索 注册 表 ， 并 在 
完成 后 癌 你 返回 标识 符 。 最 近 ， 我 们 已 经 采用 这 些 组 件 中 的 两 个 一 一 注 
册 表 和 存储 库 ， 并 将 其 合并 成 一 个 具有 存储 库 或 注册 表 功 能 的 转 键 系 
统 ， 因 为 存储 库 需 要 注册 表 ， 才 能 知道 存储 库 中 有 什么 ， 而 注册 表 需 要 
存储 库 来 保存 元 数据 记录 。 我 们 现在 已 经 做 出 来 了 了， 你 可 以 在 网 上 通过 
URL cordra.org 找 到 一 个 版 本 。 


简 而 言 之 就 是 这 样 。 对 于 框 殿 而 言 有 趣 的 一 点 是 ， 任 何 采 用 它 的 
人 ， 无 论 他 们 在 后 合 使 用 什么 技术 《就 像 如 果 你 使 用 耳 地址， 你 可 以 在 
后 台 使 用 任何 一 台电 脑 ) ， 都 能 得 到 可 互 操 作 的 系统 ， 并 解决 所 有 和 事 
物 大 小 相关 的 问题 。 你 可 以 在 循环 中 使 用 存储 库 ， 访 问 这 些 数 字 对 象 ， 
并 将 其 存储 供 以 后 演示 。 它 带 有 内 置 的 安全 性 ， 因 为 解析 系统 可 以 存储 
公开 密 古 。 因 此 ， 它 允许 你 调用 公 钥 基础 设施 ( PKI ) 的 所 有 功能 ， 而 
且 无 须 承 担任 何 额外 成 本 。 我 认为 ， 这 是 一 个 非常 好 的 管理 信息 前 进 的 
模型 ， 因 为 它 不 仅 将 信息 保持 在 一 起 ， 同 时 它 也 是 上 自己 的 内 部 编目 系 


Ss 


作者 : 围绕 数字 对 象 运行 的 互联 网 和 围绕 数据 字 节 运行 的 互联 网 看 
起 来 有 什么 区 别 ? 


鲍 勃 : 我 认为 这 不 一 定 会 影响 到 今天 互联 网 的 底层 部 分 ， 因 为 你 可 
以 把 存储 库 连 接 到 今天 的 互联 网 中 。 你 可 以 使 用 注册 表 、 组 合 版 本 ， 或 
者 句柄 系统 。 它 们 只 是 利用 今天 互联 网 中 的 一 切 ， 如 果 你 有 东西 可 以 做 
到 这 一 点 ， 它 可 能 也 可 以 利用 这 一 点 。 所 以 这 不 是 单 向 的 ， 它 们 可 以 互 
相 利 用 。 如 果 它 是 数字 对 象 ， 通 过 以 太 网 ， 它 将 被 以 一 种 方式 处 理 。 如 
果 通 过 令 牌 环 网 ， 它 可 能 会 受到 略 有 不 同 的 处 理 。 底 层 通 信 技 术 将 做 到 
这 点 。 它 可 以 以 各 种 方式 把 它 分 解 成 比特 和 字 节 。 但 最 终 ， 只 要 所 有 的 
比特 到 达 男 一 端 ， 同 时 你 可 以 验证 它们 被 正确 接收 ， 那 么 你 就 真 的 不 应 
该 天 心 下 面 发 生 了 什么 ， 只 要 它 的 效率 和 成 本 效益 高 就 行 。 


作者 : 你 说 ， 如 果 回 到 1974 年 ， 你 可 能 会 把 数字 对 象 框架 更 多 地 放 
入 TCP/IP 中 。 你 具体 会 采取 什么 不 同 的 行动 ? 


鲍 勃 : 不 ， 我 不 会 把 它 放 入 TCP/IP 中 。 我 会 从 那个 构想 开始 ， 并 看 
它 如 何 适用 于 不 同 的 网 络 环境 ， 因 为 如 果 你 面 对 的 是 一 个 可 互 操 作 的 系 
统 ， 并 且 它 知道 如 何 通过 协议 接口 沟通 ， 它 将 完全 可 互 操作 地 处 理 任何 
其 他 系统 。 问 题 是 ， 你 如 何 将 比特 传输 到 那里 ? TCP/IP 被 开发 来 处 理 各 
种 应 用 程序 中 分 散 的 网 络 系统 ， 你 可 以 直接 使 用 它 。 或 者 如 果 你 愿意 ， 
可 以 想象 重新 考虑 互联 网 的 基础 结构 。 但 请 记 住 ， 互 联网 分 布 于 世界 各 
地 ， 你 不 大 可 能 改变 一 切 ， 至 少 不 会 立即 改变 ， 也 许 永远 都 不 能 改变 一 
切 。 所 以 你 需要 处 理 所 有 的 变幻 莫 测 ， 包 括 今 天 互联 网 中 存在 的 情况 ， 
并 且 保 持 前 进 。 


作者 : 今天 的 互联 网 和 你 想象 的 有 什么 不 同 ? 
鲍 过 : 大 不 一 样 。 当 我 们 刚 起 步 时 ， 我 认为 这 是 一 个 研究 实验 。 我 


们 想 知 道 ， 如 何 能 使 不 同 网 络 一 起 工作 ， 让 这 些 网 络 上 的 电脑 能 够 互相 
交流 ， 所 以 刚 开始 时 我 们 只 假设 有 少量 的 网 络 和 少量 的 计算 机 。 请 记 

住 ， 当 我 们 刚 起 步 时 ， 并 没有 工作 站 或 个 人 电脑 等 。 你 唯一 能 使 用 的 是 
大 型 分 时 系统 。 这 些 都 是 价值 数 百 万 美元 的 机 器 ， 世 界 上 很 少 有 人 拥有 
它 ， 我 们 起 步 时 也 许 只 有 100 家 机 构 拥 有 。 这 残 是 我 们 所 看 到 的 情况 ， 

当时 ， 它 在 一 点 点 成 长 。 然 后 周围 突然 出 现 了 工作 站 ， 到 20 世 纪 80 年 代 
初 ， 个 人 电脑 开始 出 现 。 然 后 ， 比 起 拥有 100 台 机 器 ， 我 们 想 也 许 会 有 
数 千 台 ， 上 万 台 ， 甚 至 数 十 万 台 ， 如 今 有 多 少 ? 大概 有 30 亿 台 设 备 在 网 
上 ， 而 物 联网 中 可 能 有 200 亿 到 1 000 亿 人 台 。 


作者 : 也 就 是 说 ， 连 接 设备 的 数量 有 了 很 大 的 增长 。 


鲍 勃 : 我 们 已 经 有 了 比 以 前 多 得 多 的 连接 设备 。 有 了 时候， 即使 在 同 
一 台 机 器 上 ， 也 会 有 很 多 虚拟 机 和 应 用 程序 在 同一 设备 上 运行 。 我 想 还 
可 以 说 ， 我 们 见证 了 带宽 的 扩展 。 最 初 网 速 只 有 50 比 特 / 秒 ， 我 认为 ， 
现在 设想 网 速 平 均 达 到 10 到 100 千 兆 位 / 秒 ， 不 是 没有 道理 的 ， 所 以 内 存 
增长 了 约 100 万 倍 。 在 计算 能 力 方 面 ， 以 前 的 机 需 可 能 会 被 今天 最 便宜 
的 数字 手表 打败 ， 所 以 计算 速度 至 少 提高 了 100 万 倍 ， 同 时 它 没有 任何 
放 慢 的 迹象 。 因 此 ， 也 许 10 年 后 将 增长 10 亿 倍 。 在 科技 史 中 ， 没 有 其 他 
技术 的 贡献 可 以 超过 这 一 范围 。 


作者 : 确实 如 此 。 在 这 个 令 人 印象 非常 深刻 的 过 程 中 ， 你 认为 数学 
在 这 些 系统 的 分 析 和 设计 中 发 挥 了 什么 作用 ? 


鲍 勃 : 这 是 一 个 很 有 趣 的 问题 。 在 职业 生涯 初期 ， 我 曾 打算 从 事 学 
术 工 作 。 我 认为 我 基本 是 沿 着 传统 数学 教育 路 线 接受 训练 的 。 我 对 数学 
中 的 问题 很 感 兴趣 ， 而 且 很 擅长 处 理 其 中 的 一 些 问 题 。 当 然 ， 有 比 我 聪 
明 得 多 的 人 在 处 理 真 正 复杂 的 理论 数学 问题 。 但 我 及 现 ， 我 处 理 的 应 用 
数学 问题 真 的 很 有 趣 ， 我 喜欢 这 种 工作 。 此 外 ， 这 些 年 来 ， 已 经 出 现 了 
很 多 与 网 络 有 关 的 有 趣 结 果 。 里 特 尔 的 定理 就 是 一 个 例子 。 雷 恩 :元 莱 


恩 洛克 对 独立 性 假设 进行 研究 ， 他 通过 假设 傈 些 无 法 证 明 是 独立 的 情 
况 ， 成 功 证 明了 网 络 性 能 的 一 些 方面 。 但 仅仅 假设 它们 是 独立 的 ， 他 区 
可 以 得 到 封闭 形式 的 解决 方案 。 


我 、 雷 恩 : 克 莱 恩 洛克 和 霍华德 :弗兰克 写 了 一 篇 文章 。 霍 华 德 为 阿 
帕 网 做 了 所 有 的 早期 布局 设计 。 我 们 三 个 人 写 的 一 篇 论文 叫 作 “计算 机 
通信 理论 和 设计 的 经 验 教训 ”。 我 们 当时 提出 的 一 个 问题 是 : 我 们 如 何 
知道 应 该 设计 和 建造 多 大 的 网 络 ? 我 们 都 思考 了 这 个 问题 ， 并 且 每 个 人 
都 有 自己 的 想法 ， 不 过 答案 都 在 60 或 64 节 点 左右 。 我 们 知道 彼此 的 答案 
后 说 ， 这 真是 奇妙 啊 。 我 们 对 此 都 有 相同 的 看 法 ， 为 什么 呢 ? 雷 恩 首先 
插话 ， 他 说 ， 当 解 开 吞吐 量 和 网 络 的 延迟 方程 时 ， 该 方程 的 分 母 趋 于 
零 ， 节 点 的 数量 大 约 是 60。 因 此 ， 我 们 最 多 可 以 达到 60， 因 为 这 个 方程 
趋 于 无 穷 大 。 霍 华 德 说 ， 这 真 的 很 有 趣 ， 因 为 我 没有 关注 数学 ， 但 我 做 
了 大 量 的 模拟 工作 ， 当 达到 60 个 节点 时 ， 我 在 模拟 中 用 完了 内 存 空间 ， 
并 且 无 法 再 继续 计算 。 我 说 ， 这 真 的 很 有 趣 ， 因 为 当时 是 1972 年 ， 阿 由 
网 刚刚 建立 。 我 说 ， 我 们 今天 在 50 千 位 的 线路 上 运行 ， 如 果 你 看 一 看 路 
由 表 ， 如 果 路 由 表 远 远大 于 60 或 64 个 节点 ， 网 络 带 宽 中 的 每 个 比特 都 会 
在 通过 路 由 表 时 被 消耗 掉 ， 我 们 不 知道 该 怎么 人 办。 当然 ， 现 在 如 果 我 们 
使 用 百 万 位 的 线路 ， 那 么 这 个 制约 就 不 会 存在 ， 如 果 有 更 多 内 存 ， 霍 华 
德 的 模拟 就 不 会 失败 。 雷 恩 的 方程 可 能 需要 进行 不 同 的 调整 。 但 基本 结 
论 是 ， 这 是 有 三 种 不 同 的 思考 角度 ， 但 事实 证 明 ， 具 体 实施 没有 在 很 大 
程度 上 依赖 于 模拟 ， 而 模拟 没有 在 很 大 程度 上 取决 于 数学 ， 所 以 它们 只 
是 解决 问题 的 三 种 不 同方 式 。 


现在 ， 我 不 能 为 所 有 可 能 的 应 用 都 下 结论 。 我 认为 ， 未 来 可 能 有 越 
来 越 多 的 案例 ， 你 真 的 需要 良好 的 数学 模型 来 知道 这 些 构想 是 否 会 有 
效 ， 但 我 还 不 知道 它们 会 是 什么 。 


作者 : 鲍 勃 ， 谢 谢 你 与 我 们 分 享 你 的 想法 。 


第 六 部 分 
端 到 庙 


对 于 电脑 来 说 ， 互 联网 有 时 看 起 来 像 一 个 黑金 子 。 它 传送 和 接收 
你 的 消息 ， 却 不 知道 你 和 正在 交流 的 其 他 人 之 间 的 网 络 内 部 到 底 发 生 
了 什么 。 

端 到 端 控制 是 我 们 的 第 六 条 ， 也 是 最 后 一 条 网 络 原理 。 在 第 13 
章 ， 我 们 将 看 到 互联 网 设备 如 何 利用 来 自 接收 者 的 反馈 ， 来 推断 和 管 
理 网 络 中 的 拥塞 。 这 要 求 设备 之 间 进 行 分 布 式 协调 ， 当 它们 正确 接收 


数据 包 时 ， 通 过 网 络 来 回 发 送 彼此 的 确认 消息 。 


拥塞 控制 将 结束 我 们 对 互联 网 内 部 运作 情况 长 达 三 章 的 讨论 。 在 
第 14 章 中 ， 我 们 将 回 到 社会 网 络 ， 了 解 人 们 如 何 仍然 可 以 在 看 似 相对 
的 网 络 两 端 被 连接 。 正 如 我 们 将 看 到 的 ， 它 要 求人 们 仅 使 用 本 地 信息 
发 现 短路 径 ， 使 它 即使 在 如 此 庞大 并 不 断 扩 张 的 网 络 中 ， 也 能 成 为 一 
个 小 世界 。 


第 13 章 
控制 拥 声 


在 第 12 章 讨论 分 组 路 由 时 ， 我 们 从 来 没有 说 过 一 次 可 以 传输 多 少数 
据 包 。 由 于 组 成 互联 网 链接 的 便 件 只 能 以 这 个 速度 发 送 比 特 ， 因 此 需要 
有 一 种 方法 来 控制 流量 。 传 输 层 的 任务 是 ， 确 保 对 互联 网 的 需求 不 超过 
链接 的 供应 。 当 超过 时 ， 必 须 运行 终端 主机 的 拥塞 控制 (congestion 
control) ， 使 需求 回落 到 可 接受 的 水 平 。 


如 何 控制 拥 培 ? 


请 看 图 13-1， 它 显示 了 一 条 链接 上 的 拥塞 示例 。 爱 丽 丝 目前 以 30 
Mbps 的 速度 发 送 数据 ， 而 鲍 勃 以 20 Mbps 的 速度 发 送 ( 记 住 ，Mbps 是 衡 
量 速 度 的 标准 ， 即 每 秒 百 万 比特 ) 。 链 接 容量 是 40 Mbps， 表示 它 每 秒 
可 以 传输 达 4 000 万 比特 ， 而 用 户 共 需 要 50 Mbps， 超 出 25%。 需 求 超过 
供给 。 
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图 13-1 
注 : 两 个 用 户 对 链接 的 需求 总 和 (30 + 20 = 50 Mbps) 高 于 链接 的 容量 40 Mbps， 
造成 拥堵 


那么 ， 会 发 生 什 么 呢 ? 数据 包 开 始 积聚 在 链接 前 端的 缓冲 区 中 。 它 
们 被 存储 在 那里 ， 形 成 队列 ， 等 每 个 传 送 的 机 会 。 那 就 像 是 被 困 在 交通 
堵 蹇 中 《图 13-2) ， 路 上 的 车 流量 导致 大 家 都 要 慢 慢 问 前 挪动 ， 直 到 它 
们 排 到 队伍 的 前 面 ， 才 可 以 继续 前 进 。 人 困 在 交通 堵 野 中 的 时 间 类 似 于 
数据 包 在 传输 前 排队 等 待 的 时 间 〈 不 过 两 者 处 于 极为 不 同 的 时 间 维 度 ， 


一 个 是 分 钟 ， 一 个 是 毫秒 ) 。 


图 13-2 互联 网 中 的 拥塞 类 似 于 我 们 遇 到 的 交通 堵塞 


更 糟 的 是 ， 随 着 越 来 越 多 的 汽车 进入 交通 埔 塞 ， 对 于 稍 后 进入 的 人 
来 说 ， 线 路 会 变 得 更 长 。 同 样 ， 随 着 更 多 数据 包 堆 积 到 缓冲 区 ， 队 列 会 
变 得 更 长 ， 拥 去 也 会 越 来 越 严 重 。 最 终 ， 绥 冲 区 会 溢出 ， 导 致 数据 包 被 
丢弃 ， 就 像 水 从 已 经 法 满 的 桶 顶部 淤 出 一 样 。 上 其 体 哪些 数据 包 会 被 丢 
弃 ， 取 决 于 队列 管理 协议 的 详细 信息 。 


互联 网 (特别 是 传输 层 ) 如何 控制 这 一 点 ? 


20 世 纪 80 年 代 末 ， 计 算 机 科学 家 范 : 雅 各 布 森 提出 第 一 代 拥 墅 控制 
机 制 。 它 被 称 为 TCP 太 浩 (TCP Tahoe) ， 得 名 于 内 华 达 山脉 的 太 浩 湖 
(我 们 将 看 到 ， 许 多 拥塞 控制 算法 都 是 以 这 种 方式 命名 ) 。 它 于 1988 年 
首先 成 为 TCP 协 议 的 一 部 分 ， 并 被 认为 在 20 世 纪 80 年 代 末 90 年 代 初 挽救 
了 互联 网 骨 沉 。 此 后 ，TCP 太 浩 被 广泛 研究 ， 并 经 过 多 次 改进 ， 但 在 它 


的 早期 版 本 中 ， 互 联网 拥塞 控制 的 许多 基本 思路 就 已 经 出 现 。 


义 是 反馈 


还 记得 我 们 在 第 2 章 谈 到 的 无 线 设备 发送 确认 吗 ? 利用 TICP， 互 联 
网 的 终端 主机 (end hosts) 遵循 类 似 的 系统 : 对 于 发 射 器 发 在 互联 网 
上 的 每 个 数据 包 ， 当 《以 及 如 果 ) 其 成 功 到 达 接 收 右 ， 对 方 将 回复 确认 
(ACK) 包 给 发 送 器 。 你 可 以 在 图 13-3 中 看 到 这 个 理念 : 当 终 端 主机 收 
到 确认 ， 它 便 知 道 数据 包 发 送 成 功 。 否 则 ， 一 段 时 间 后 ， 它 会 党 试 重新 
发 送 数据 包 。 
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图 13-3 


注 : 当 发 送 端 发 送 数 据 包 后 ， 接 收 端 发 送 确认 (ACK) ， 表 示 正 确 接 收 。 确 认 是 负 反 
馈 信 号 ， 它 向 发 送 端 提供 衡量 网 络 拥塞 的 标准 

尽管 确认 提高 了 可 徘 性 ， 但 可 以 想象 ， 其 本 喘 实际 上 会 使 拥堵 更 加 
严重 。 在 拥挤 的 网 络 中 ， 数 据 包 可 能 会 延迟 很 长 时 间或 被 完全 丢弃 ， 导 
致 接收 絮 不 发 送 确 认 。 没 有 确认 ， 友 送 剖 将 重 发 数据 包 ， 在 已 经 拥挤 不 
堪 的 系统 缓冲 区 中 增加 更 多 数据 。 当 这 些 重 发 数据 同样 得 不 到 确认 时 ， 
它们 将 尝试 再 次 发 送 ， 以 此 类 推 ， 导 致 恶性 循环 。 


但 确认 系统 还 提供 了 一 个 管理 拥堵 的 巧妙 方式 。 发 射 器 可 使 用 确认 
(或 确认 缺失 ) 来 推 呆 网 络 的 条 件 ， 因 为 这 些 确 认 表 明 数 据 包 是 售 以 及 


多 久 会 到 达 目 的 地 。 如 果 数 据 包 成 功 到 达 ， 那 么 它们 可 以 继续 发 送 ， 也 
许 会 以 更 快 的 速度 发 送 ， 因 为 快速 确认 可 能 表明 路 径 没 有 被 完全 局 用 。 
但 这 些 确认 被 卡 住 或 丢失 表示 网 络 出 现 拥 帮 ， 所 以 一 旦 发 生 这 种 情况 ， 
发 射 器 应 减少 发 送 速 率 ， 以 缓解 拥堵 。 


这 样 ， 确 认可 以 作为 给 发 送 端的 反馈 信号 ， 用 来 表示 传输 速率 应 何 
时 降低 或 提高 。 我 们 已 经 看 到 ， 负 反馈 作为 网 络 的 一 个 重要 主题 ， 在 本 
书 中 多 次 出 现 ， 特 别 是 在 第 一 部 分 ， 它 帮助 手机 控制 其 功率 水 平 ( 第 1 
章 ) ， 帮 助 Wi-Fi 设 备 降 低 其 传输 速率 (第 2 草 ) ， 以 及 帮助 互联 网 服务 
提供 商 规 范 数 据 需 求 〈( 第 3 革 )〉 。 我 们 在 第 9 章 中 讨论 如 何 触发 信息 瀑布 
时 ， 提 到 与 之 相对 的 正 反 馈 。 在 互联 网 上 ， 负 反馈 对 于 防止 拥塞 衣 误 也 
古 非 常 重要 的 。 负 反馈 往往 是 “正面 ”的 事物 ! 


那么 ， 如 果 在 拥塞 控制 机 制 中 ， 让 互联 网 的 路 由 器 而 非 终 端 主机 负 
责 决定 发 射 器 应 该 使 用 什么 速率 ， 情 况 会 怎样 ? 这 听 起 来 似乎 很 直观 : 
毕竟 ， 真 正 处 于 网 络 中 的 是 路 由 器 ， 所 以 它们 很 可 能 会 很 好 地 推断 链 路 
拥塞 。 但 是 ， 如 果 路 由 器 管理 拥塞 ， 它 们 将 需要 监视 端 到 端的 连接 。 这 
也 违背 了 我 们 在 第 11 章 提 到 过 的 互联 网 的 端 到 端 设计 (end-to-end 
design) 理念 : 把 适合 终端 主机 的 工作 留 给 它们 。 通 过 TCP， 拥 塞 控制 
由 终端 主机 负责 。 


请 动 窗口 


随 着 反馈 机 制 到 位 ， 下 一 步 是 决定 终端 主机 将 如 何 使 用 它 来 调节 其 
传输 。 也 许 我 们 可 以 让 终 问 主机 发 送 一 个 数据 包 ， 然 后 等 竺 该 数据 包 的 
确认 ， 之 后 再 发 送 万 一 个 ?“ 一 个 接 一 个 ”的 方案 会 很 慢 而 且 很 低 效 ， 因 
为 这 表示 每 台 终 端 主机 每 次 只 能 在 网 络 上 发 送 一 个 数据 包 。 


TCP 通 过 提供 大 于 1 的 定量 进行 传输 。 每 个 发 送 端 都 保持 一 个 拥塞 
窗口 (congestion window) ， 对 其 可 以 在 网 络 上 同时 传输 的 未 完成 / 


未 确认 的 数据 包 数 量 进行 限制 。 窗 口 大 小 越 大 ， 人 允许 的 未 完成 数据 包 就 
越 多 : 如 宋 窗口 大 小 是 3， 那 么 在 发 送 端 必须 暂停 并 等 待 确 认 包 返回 之 


前 ， 可 以 最 多 发 送 三 个 数据 包 。 你 可 以 在 图 13-4 中 看 到 : 发 送 端 每 收 到 
一 个 新 的 确认 ， 窗 口 便 癌 右 侧 滑 劲 一 个 数据 包 ， 多 许 发 送 一 个 新 数据 
包 。 因 为 这 种 行为 ， 它 有 时 被 称 为 “滑动 窗口 ”。 

茵 i 洁 3 
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图 13-4 

注 : 对 于 每 个 正确 接收 的 确认 ， 拥 塞 窗口 会 向 右 滑动 一 个 数据 包 ， 允 许 终端 主机 将 
另 一 个 数据 包 发 送 到 网 络 中 

TCP 的 滑动 窗口 类 似 于 第 7 章 开 头 提 到 的 网 飞 的 DVD 租赁 方法 。 网 
飞 允 许 租赁 者 一 次 带 走 固定 数量 的 电影 ， 这 个 数量 取决 于 他 们 每 月 支付 
多 少 费 用 。 他 们 付 的 钱 越 多 ， 就 能 同时 带 走 越 多 的 电影 ， 可 以 说 ， 这 给 
了 他 们 更 大 的 “窗口 ?。 如 果 一 个 人 取 走 了 最 大 限额 的 DVD， 他 必须 先 归 
还 一 张 DVD， 才 能 拿 走 男 一 张 。 


扩大 和 缩小 窗口 大 小 
如 果 拥塞 窗口 是 调节 流量 的 手段 ， 那 么 它 如 何 适 应 网 络 条 件 ? 


如 果 发 射 器 没有 感知 任何 拥塞 ， 则 应 该 允许 窗 口 大 小 扩大 ， 以 使 网 
络 供应 得 到 最 佳 利用 。 和 否则 ， 我 们 将 不 能 充分 利用 分 组 交换 的 效率 。 让 
我 们 明确 一 点 : 增加 窗口 和 滑动 窗口 是 不 同 的 ， 它 除 了 向 前 滑动 外 ， 还 
会 变 得 更 大 。 在 网 飞 的 DVD 类 比 中 ， 滑 动 窗口 就 像 是 归还 一 张 DVD， 
增加 窗口 大 小 就 像 订 购 更 高 限额 的 DVD 服务 。 


TCP 的 一 个 常见 目标 ， 是 在 当前 窗口 内 所 有 数据 包 都 被 正确 接收 
后 ， 以 1 为 单位 线性 增加 窗口 大 小 。 因 此 ， 如 果 窗 口 大 小 为 93， 当 发 送 端 
收 到 3 个 数据 包 的 确认 后 ， 窗 口 可 能 会 增加 到 4。 然 后 ， 一 旦 4 个 数据 包 
被 确认 ， 窗 口 将 增加 到 5， 以 此 类 推 ， 如 图 13-5 所 示 。 更 多 关于 如 何 实 
现 线性 增加 的 信息 ， 请 参考 本 书 网 站 Q13.1 部 分 。 
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图 13-5 


注 : 最 初 (时 间 1) ， 窗 口 是 3， 所 以 发 送 端 通过 网 络 发 送 三 个 数据 包 。 接 收 端 收 到 
每 个 数据 包 (时间 2) ， 并 依次 发 送 确认 。 当 发 送 端 收 到 三 个 确认 (时间 3) 后 ， 它 
的 窗口 增加 到 4 

与 此 相反 ， 当 拥塞 出 现时 ， 窗 口 大 小 会 减少 。 对 于 其 发 送 的 下 一 个 
满 窗 数据 包 ，TCP 通 常 不 是 线性 减少 窗 而 是 试图 成 倍 减 今 ， 确 
切 地 说 是 减少 一 半 。 因 此 ， 如 果 窗 口 是 8 时 ， 终 端 主机 检测 到 拥塞 ， 它 


可 能 会 减少 到 4。 如 果 在 下 一 个 数据 包 中 仍然 检测 到 拥塞 ， 则 窗口 数 可 
能 减少 到 2， 以 此 类 推 。 这 种 成 倍 减少 的 数量 级 ， 和 我 们 在 第 2 章 看 到 的 
Wi-Fi 设 备 在 碰撞 后 退 避 的 情况 相同 。 记 得 那里 也 有 一 个 用 于 调节 Wi-Fi 
传输 的 窗口 ， 只 是 对 于 Wi-Fi 来 说 ， 更 高 的 竞争 窗口 意味 着 更 低频 率 的 
传输 ， 而 对 于 TCP 来 说 ， 更 高 的 拥塞 窗口 意味 着 更 高 的 传输 速率 。 


对 拥塞 窗口 大 小 进行 加 法 式 增 加 和 乘法 式 减少 ， 意 味 着 对 数据 包 注 
入 网 络 的 控制 是 保守 的 。 如 果 两 者 操作 方式 相反 ， 它 将 更 加 积极 : 乘法 
式 增 加 和 加 法 式 减 少 。 事 实 上 ， 在 拥塞 避免 (congestion 
avoidance) 阶段 之 前 ，TCP 通 常 有 一 个 慢 启动 (slow start) 阶段 ， 
当 终 端 主 机 之 间 的 连接 初次 建立 时 ， 窗 口 的 大 小 会 更 积极 地 增加 。“ 快 
启动 ”可 能 是 形容 这 段 时 间 更 合适 的 名 称 ， 因 为 在 此 期 间 ， 窗 口 会 迅速 
上 升 到 合理 值 。 


那么 ， 终 端 主机 一 开始 究竟 如 何 推断 是 否 有 拥塞 ? 毕竟 ， 它 们 不 知 
道 网 络 是 什么 样子 的 。 它 们 不 知道 自己 的 数据 包 选 择 什么 路 径 ， 还 有 哪 
些 终端 主机 与 它们 共享 链接 ， 或 哪些 沿 着 路 径 的 链接 是 拥挤 的 。 它 们 只 
有 通过 收 到 的 确认 数据 包 才能 了 解 情况 ， 但 它们 都 必须 做 出 合理 猜测 : 
它们 的 连接 是 人 否 在 网 络 中 的 茶 个 地 方 会 遇 到 拥 赛 ? 这 是 网 络 中 分 布 式 协 
调 的 挑战 ! 


如 何 推 断 拥 堵 ? 

多 年 来 ， 人 们 提出 了 许多 拥塞 控制 算法 ， 其 中 的 一 部 分 已 经 在 广泛 
部 署 的 系统 中 实现 。 所 有 主要 算法 都 使 用 负 反馈 控制 的 滑动 窗口 来 调节 
传输 速率 。 它 们 之 间 的 区 别 在 于 如 何 推断 拥塞 ， 这 对 窗口 大 小 的 更 新 具 
有 不 同意 义 。 


数据 包 丢 失 成 为 信号 


拥塞 控制 的 最 早 版 本 是 1988 年 推出 的 TCP 太 浩 ， 其 稍微 修改 后 的 版 
本 是 1990 年 推出 的 TCP 里 诺 (TCP Reno) (得 名 于 内 华 达 州 太 浩 湖 附 
近 的 城市 里 诺 ) 。 它 们 做 出 一 个 重要 假设 : 如 果 发 生 数 据 包 丢失 ， 那 么 
就 会 出 现 拥 塞 。 这 听 起 来 很 合理 。 乍 一 看 ， 这 也 很 容易 实现 : 由 于 成 功 
的 确认 意味 着 数据 包 被 传递 ， 那 么 缺少 确认 应 该 表示 数据 包 丢 失 。 但 
是 ， 我 们 如 何 确定 没有 发 送 确认 呢 ? 也 许 它 只 是 延迟 ， 或 者 可 能 发 送 了 
确认 ， 但 它 在 返回 的 路 上 丢失 。 


TCP 使 用 两 个 符合 常识 的 估计 ， 对 数据 包 是 否 丢失 进行 合理 猜测 。 
第 一 个 是 : 如 果 发 送 端 等 竺 很 长 时 间 ， 并 且 数 据 包 的 确认 没有 返回 ， 数 
据 包 便 可 能 丢失 。 多 长 时 间 算 <“ 长 ””TCP 基 于 发 送 端 和 接收 端 之 间 的 往 
返 时 间 (round-trip time) 《简称 RITT) ， 设 置 超时 计数 器 。 往 返 时 
间 是 数据 包 到 达 接 收 端 需要 的 时 间 ， 加 上 该 数据 包 确 认 返 回 发 送 端 需要 
时 间 之 和 。 超 时 计数 器 数值 可 能 是 正常 往返 时 间 的 3 倍 ， 这 样 就 可 以 留 
出 足够 的 时 间 来 看 数据 包 是 否 只 是 延 人 运 了 。 


“正常 ”的 往返 时 间 是 什么 ? 这 是 一 个 数据 包 在 合理 网 络 条 件 〈“ 即 没 
有 太 多 拥塞 ) 下 的 往返 时 间 。 人 发 送 恬 经 历 最 小 的 最 近 往 返 时 间 值 可 以 大 
致 理解 为 无 堵 窟 的 正常 往返 时 间 。 


你 可 以 在 图 13-6 中 看 到 推 央 拥塞 的 第 一 个 规则 的 例子 。 发 送 问 和 接 
收 端 建立 TCP 连 接 10 曼 秒 后， 发 送 端 发 送 两 个 数据 包 。 途 中 ， 在 25 昌 秒 
时 ， 第 二 个 数据 包 遇 到 延迟 ， 最 终 和 " 丢 和 并。 第 一 个 数据 包 在 35 坚 秒 后 到 
达 目 的 地 ， 发 送 端 在 60 坚 秒 时 收 到 确认 。 这 个 数据 包 的 往返 时 间 是 发 送 
和 确认 时 间 之 间 的 差 值 : 60 - 10 = 50 量 秒 。 发 送 端 可 以 使 用 一 些 最 近 观 
测 到 的 往返 时 间 平 均值 “如 50 暑 秒 ) 作为 正 间 往返 时 间 。 在 该 数值 大 约 
3 倍 时 间 后 ， 如 150 坚 秒 ， 数 据 包 2 将 会 超时 ， 发 送 端 会 〈 理 所 当然 地 ) 
假定 它 已 经 丢失 。 


接收 端 
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图 13-6 


注 : 一 个 数据 包 在 很 长 时 间 (如 正常 往返 时 间 的 3 倍 ) 后 未 得 到 确认 ， 就 可 能 已 经 丢 
失 。 在 这 个 例子 中 ， 数 据 包 1 在 发 送 50 毫 秒 后 被 确认 ， 而 数据 包 2 将 最 终 超时 ， 并 被 
宣布 丢失 

第 二 个 估计 是 : 如 果 发 送 端 在 等 竺 一 个 数据 包 的 确认 时 ， 收 到 了 之 
后 发 送 的 几 个 数据 包 的 确认 ， 那 么 这 个 未 确认 的 数据 包 可 能 已 经 丢失 。 
由 于 每 个 数据 包 在 传输 之 前 被 分 配 了 序列 号 ，TCP 便 可 以 跟踪 传输 顺 
序 。 运 用 这 个 方法 ， 它 可 以 得 知 数据 包 1 最 先 发 送 ， 数 据 包 2 其 次 ， 以 此 


类 推 。 


你 可 以 在 图 13-7 中 看 到 此 示例 ， 其 中 发 送 端正 在 等 竺 数据 包 9 的 确 
认 。 它 开始 得 到 数据 包 9 之 后 发 送 的 几 个 数据 包 《【〈 编 号 10、11、12) 的 
确认 ， 但 仍 没 有 来 目 数 据 包 9 的 确认 。 当 然 ， 数 据 包 9 可 能 走 过 了 一 条 不 
同 的 路 径 ， 往 返 时 间 更 长 。 但 如 果 之 后 多 达 3 个 数据 包 的 确认 都 已 经 到 
达 ， 该 数据 包 很 可 能 不 仅仅 是 迟到 ， 而 是 丢失 了 。 对 于 分 布 式 协调 来 
说 ， 这 些 部 是 非 第 简单 但 很 聪明 的 方法 。 


发 送 病 
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+ 


图 13-7 


注 : 如 果 一 个 数据 包 在 之 后 几 个 数据 包 得 到 确认 后 ， 仍 然 没有 确认 ， 则 可 能 已 丢 
失 。 在 这 个 例子 中 ， 发 送 端 在 序列 中 的 第 九 个 数据 包 之 后 ， 收 到 三 个 数据 包 的 确 
认 ， 此 可 以 假设 数据 包 9 已 经 丢失 

基于 丢 包 的 拥塞 推 凯 是 近 10 年 来 的 标准 ， 但 这 种 方法 没有 考虑 到 几 
个 因素 。 一 方面 ， 除 了 拥塞 外 ， 还 有 其 他 因素 可 能 导致 数据 包 丢 失 : 信 
道 质量 差 。 这 对 于 无 线 网 络 尤其 如 此 。 记 得 在 第 一 部 分 ， 我 们 谈 到 的 手 
机 信号 相互 干扰 和 Wi-Fi 传 输 碰 撞 吗 ?这 两 种 情况 都 可 能 导致 大 量 数 据 
包 丢 失 ， 但 它们 并 不 表示 互联 网 内 部 出 现 拥塞 。 实 际 上 ， 有 很 多 人 建议 
采用 TCP 无 线 ， 以 减轻 这 些 问题 。 


基于 丢失 的 推 新 的 另 一 个 问题 是 ， 当 数据 包 被 丢弃 时 ， 对 拥塞 做 出 
反应 往往 已 经 太 晚 。 拥 挤 的 路 径 上 的 许多 剩余 数据 包 可 能 也 开始 被 丢 
弃 ， 以 迫使 发 送 端 重新 发 送 。 这 种 情况 可 以 通过 切换 到 另 一 个 推断 信号 
加 以 缓解 ， 我 们 将 在 下 一 节 讨 论 。 


数据 包 延 迟 成 为 反馈 


在 太 浩 和 里 诺 之 后 ，TCP 韦 加 斯 (TCP Vegas) 于 1995 年 被 发 明 。 
除了 以 内 华 达 州 的 另 一 个 地 方 〈 这 次 是 它 最 大 的 城市 ) 命名 ，TCP 韦 加 
斯 推出 了 一 个 控制 拥塞 的 新 模式 : 使 用 数据 包 延 迟 ， 而 不 是 数据 包 丢 
失 ， 作 为 推断 信号 


怎样 对 延迟 进行 测量 ? 也 许 发 射 器 可 以 将 数据 包 的 往返 时 间 与 之 前 
讨论 的 正 弟 往返 时 间 比 较 。 这 似乎 是 正当 的 《实际 上 也 是 ) ， 但 原因 并 
不 简单 ， 因 为 〈 主 要 ) 有 两 种 延迟 影响 数据 包 的 往返 时 间 ， 而 其 中 只 有 
一 种 指示 拥塞 。 你 可 以 在 图 13-8 中 看 到 这 些 组 成 部 分 。 即 使 在 网 络 中 没 
有 其 他 数据 包 ， 仍 然 会 有 传播 延迟 (propagation delay) ， 这 与 跨 
越 从 发 送 端 到 接收 端的 链接 相关 。 信 息 从 链接 一 端 到 另 一 端的 速度 并 不 
真正 取决 于 拥 罕 ， 而 是 由 建立 链接 的 人 硬件 质量 决定 ， 并 且 受 到 物理 基本 
定律 的 限制 。 真 正 随 拥塞 情况 变化 的 是 排队 延迟 (queueing 
delay) ， 也 惑 是 数据 包 在 链接 之 间 的 路 由 需 绥 冲 区 等 竺 的 时 间 。 拥 塞 
越 严重 ， 缓 冲 区 行 数 越 长 ， 每 个 数据 包 在 链接 可 用 之 前 等 待 的 时 间 就 越 


< 排队 延迟 > 七 排 队 延 迟 ~ 


传播 延迟 
图 13-8 数据 包 的 往返 时 间 有 两 个 主要 部 分 : 传播 延迟 和 排队 延迟 
关键 是 ， 我 们 可 以 预计 往返 时 间 的 任何 变化 都 由 排队 延迟 导致。 链 


接 上 的 传播 延迟 将 在 小 的 时 间 尺 度 上 大 致 保持 不 变 。 这 使 得 延迟 成 为 判 
上 晰 拥塞 条 件 的 准确 信和 号。 


数据 包 丢 失 是 二 元 度量 方法 。 它 为 终端 主机 提供 了 两 种 可 能 性 : 拥 
塞 产生 〈 数 据 包 和 被 丢 痉 ) 或 没有 产生 《数据 包 未 被 丢弃 ) 。 延 迟 人 允许 终 
端 主机 将 拥 喜 程度 考 夸 在 内 。 如 果 延 迟 比 预 期 的 稍 多 ， 那 么 窗口 大 小 可 
以 稍微 减少 。 如 果 延 迟 比 预期 的 多 很 多 ， 窗 口 大 小 可 以 大 幅 减少 。 同 
样 ， 如 有 果 延 迟 比 预 期 的 要 少 ， 窗 口 大 小 也 可 以 被 相应 增加 。 


换 句 话说 ， 相 比 等 到 数据 包 丢 失 ， 基 于 延 述 的 推断 允许 终端 主机 啊 


应 拥塞 的 最 初 迹 象 。 你 可 以 在 图 13-9 中 看 到 一 个 示例 ， 其 中 发 送 端 已 将 
四 个 数据 包 发 送 给 一 个 接收 端 ， 彼 此 相隔 很 短 时 间 。 确 认 表 明 ， 收 到 这 
些 数据 包 的 延迟 逐渐 增加 ， 往 返 时 间 依 次 为 50、60、80 毫 秒 。 第 四 个 数 
据 包 彻底 丢失 。 利 用 基于 延迟 的 信号 ， 发 送 端 可 以 在 往返 时 间 开 始 增 加 
时 ， 逐 步 应 对 这 种 情况 ， 并 在 往返 时 间 逐 渐 增 长 时 ， 使 窗口 大 小 急剧 减 
小 。 利 用 基于 丢失 的 推 煌 ， 发 送 端 会 等 到 第 四 个 数据 包 丢 失 ， 这 对 于 防 
正 进 一 步 和 更 严重 的 延迟 和 丢失 来 说 为 时 已 晚 。 

数据 
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图 13-9 


注 : 通过 基于 延迟 的 推断 ， 发 送 端 将 为 每 个 数据 包 的 测量 往返 时 间 〈RTT) 调整 窗口 
大 小 ， 而 对 于 基于 丢失 的 推断 ， 它 直到 第 四 个 数据 包 被 宣布 丢失 才 会 减 小 窗口 大 小 

TCP 韦 加 斯 之 后 ， 在 过 去 20 年 中 ， 人 们 提出 并 在 TCP 中 实施 了 许多 
其 他 拥塞 控制 算法 。2002 年 推出 的 快速 TCP (FAST TCP) 基于 估计 延 
迟 ， 对 拥 压 窗口 调整 方式 进行 修改 ， 并 帮助 稳定 拥 赛 控制 。2005 年 推出 
的 立方 TCP (CUBIC ”TCP) 结合 基于 丢失 和 基于 延迟 的 信号 ， 成 为 
Linux 操 作 系统 的 默认 算法 ， 直 到 2012 年 被 TCP 速 率 比例 缩减 (TCP 
Proportional Rate Reduction) 取代 。 


既然 我 们 理解 了 拥塞 控制 的 核心 思想 ， 让 我 们 来 看 看 下 面 两 个 算法 
的 例子 。 


TCP 里 诡 : 侦探 的 细节 


在 推出 /4 个 世纪 后 ， 基 于 丢失 的 拥 窗 控制 算法 TCP 里 话 仍 受到 广泛 
使 用 ， 不 过 它 多 年 来 已 做 出 一 些 改进 。 其 主要 操作 其 实 很 简单 。 对 于 每 
个 满 窗 的 数据 包 ， 发 送 端 都 会 思考 : 它们 全 都 被 正确 接收 了 吗 ? 


。 如 果 是 ， 那 么 它 会 将 窗口 大 小 增加 1; 
。 如 果 不 是 ， 那 么 它 会 将 窗口 大 小 减 小 一 半 。 


一 个 数据 包 被 < 正确 接收 ?基于 我 们 之 前 讨论 的 两 个 估计 : 确认 返回 
需要 满足 (1) 在 合理 的 时 间 内 ; (2) 按照 与 最 初 传输 相应 的 序列 。 按 
照 这 个 逻辑 ， 当 〈1) 已 经 超过 一 定 的 往返 时 间 ， 或 〈2) 如 果 一 定数 量 
的 后 续 数 据 包 已 被 确认 ， 那 么 用 送 端 便 可 以 假设 一 个 数据 包 丢 失 。TCP 
里 诡 还 有 其 他 更 微妙 的 功能 ， 但 我 们 在 本 书 中 没有 时 间 讨 论 。 


我 们 将 看 到 一 个 例子 ， 来 了 解 这 个 算法 的 主要 操作 。 为 简单 起 见 ， 
假设 每 个 数据 包 的 往返 时 间 是 相同 的 ， es 
据 包 的 确认 将 同时 被 接收 。 时 间 1 表 示 一 个 往返 时 间 过 去 ， 时 间 2 表 示 
一 个 过 去 ， 以 此 类推 。 在 现实 中 ， 个 往返 时 间 在 美国 通常 约 为 50 毫 
秒 ， 它 随 着 拥塞 状况 的 变化 而 明显 变化 ， 在 不 同 数据 包 之 间 也 不 一 样 。 


当 发 送 端 与 接收 端 建 立会 话 ， 假 设 刚 开始 窗口 大 小 为 5: 


ee 
在 时 间 1， 发 送 端 得 到 所 有 5 个 数据 包 的 确认 。 它 将 窗口 向 右 
a 
在 时 间 2， 如 果 发 送 端 收 到 所 有 6 个 数据 包 的 确认 ， 会 发 生 什 
么 ? 它 将 窗口 滑动 6， 使 窗口 大 小 增加 到 7， 并 发 出 7 个 数据 包 。 


。 在 时 间 3， 如 果 它 再 次 成 功 ， 窗 口 大 小 则 变 为 8。 

。 在 时 间 4， 假 设 所 有 确认 都 已 返回 ， 除 了 第 三 个 。 由 于 其 后 5 
个 数据 包 都 已 经 得 到 确认 ， 因 此 发 送 端 将 宣布 第 三 个 丢失 。 所 以 ， 
它 将 窗口 大 小 减 半 至 4， 这 次 只 发 送 4 个 数据 包 。 你 可 以 在 图 13 - 10 
中 看 到 。 

。 在 时 间 5， 发 送 端 收 到 这 4 个 数据 包 的 确认 。 因 此 ， 它 滑动 并 
增加 窗口 ， 然 后 发 送 5 个 数据 包 。 
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图 13-10 
注 : 在 时 间 3， 窗口 大 小 从 = 77 增 加 到 8， 发 送 端 可 以 发 送 8 个 数据 包 。 当 其 中 一 个 数 
据 包 被 检测 为 丢失 ， 在 时 间 4， 窗 口 减 半 至 4 


最 初 5 个 往返 时 间 的 窗口 大 小 变化 ， 以 及 之 后 可 能 变化 的 情况 ， 如 
图 13-11 所 示 。 如 宁 你 对 图 中 显示 的 剩 下 4 个 往返 时 间 的 变化 原因 感 兴 
趣 ， 请 参考 本 书 网 站 Q13.2 部 分 。 基 本 结论 是 ， 当 没有 数据 包 丢 失 时 ， 
窗口 大 小 呈 线 性 增长 ， 而 当 发 生 数据 包 丢 失 《 在 时 间 4 和 7) 时 ， 窗 口 大 
小 急剧 下 降 。 
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注 : 利用 TCP 里 诺 ， 窗 口 不 是 线性 增加 《无 数据 包 丢 失 ) ， 就 是 乘法 式 减 少 〈 有 数据 
包 丢 失 ) 


TCP 韦 加 斯 : 侦探 的 细节 


为 了 对 比 ， 让 我 们 仔细 了 解 一 下 第 一 代 基 于 延迟 的 拥塞 控制 算法 
一 一 TCP 韦 加 斯 。 它 已 经 在 一 些 计 算 机 操作 系统 中 实现 ， 包 括 Linux 和 
FreeBSD。 


TCP 韦 加 斯 使 用 观测 到 的 往返 时 间 来 确定 当前 窗口 大 小 的 吞吐 率 ， 
也 就 是 每 秒 有 多 少数 据 包 被 确认 。 理 想 的 吞吐 率 是 ， 网 络 中 (几乎 ) 没 
有 拥 喜 时 所 能 预期 的 吞吐 率 ， 它 给 出 最 低 的 往返 时 间 。 对 于 每 个 数据 包 
的 确认 ， 终 问 主 机 会 问 : 以 当前 的 窗口 大 小 ， 目 前 的 吞吐 量 与 理想 吞吐 
量 相 比如 何 ? 


如 果 吞 吐 量 太 接 近 理 想 吞 吐 量 ， 终 端 主机 会 将 窗口 大 小 增加 


。 如 果 吞 吐 量 距 离 太 远 ， 它 会 将 窗口 大 小 减 小 1。 


如 果 吞 吐 量 刚好 合适 〈 既 不 太 近 也 不 太 远 ) ， 它 将 不 改变 窗 
吕 尖 vs 


合适 奉 吐 量 是 茶 个 规定 的 阔 值 ， 如 3。 差 值 低 于 3 则 太 近 ， 高 于 3 则 
太 远 。 


最 终 ， 如 果 算 法 经 过 适当 微调 ， 网 络 应 该 会 达到 平衡 ， 其 中 每 个 发 
送 端 都 会 获得 合适 的 否 吐 量 ， 直 到 有 新 的 变化 ， 如 建立 新 的 会 话 ， 此 时 
这 个 程序 将 寻找 新 的 平衡 。 在 平衡 状态 下 ， 网 络 处 于 效用 的 “完美 ?水 
平 ， 没 有 太 多 拥塞 ， 所 以 窗口 大 小 将 停 目 改变。 当然， 网 络 动态 的 现实 
使 “平衡 ?成 为 一 种 理想 。 


实现 对 多 用 户 发 送 速率 平衡 背后 的 数学 计算 对 于 本 书 来 说 太 高 级 了 
一 点 。 在 任何 情况 下 ， 要 达到 平衡 ， 所 有 主机 都 遵循 协议 是 非常 重要 
的 。 如 于 一 个 发 送 端 决定 从 约定 地 点 增加 其 传输 速球 ， 这 可 能 不 会 太 影 
啊 拥 守 状 况 ， 但 会 对 其 他 所 有 人 不 公平 。 如 果 别 人 也 决定 提高 速率 ， 拥 
寨 会 变 得 严重 ， 很 快 它们 都 会 处 于 比 以 前 更 糟糕 的 状态 。 这 也 许 会 使 你 
想起 ， 我 们 在 第 一 部 分 谈 到 使 网 络 资源 得 到 有 效 共有 的 不 同方 法 。 在 单 
元 中 控制 传输 功率 和 在 互联 网 中 控制 拥塞 有 不 同 的 目的 ， 但 其 工作 原理 
都 是 相同 的 : 让 每 个 设备 根据 其 收 到 的 有 关 网 络 条 件 的 反馈 ， 调 整 目 己 
的 水 平 ， 以 实现 平衡 。 如 果 没 有 适当 的 协议 ， 互 联网 可 能 会 像 第 3 章 公 
地 悲剧 中 耗 尽 的 牧场 那样 。 图 13-12 显 示 了 拥塞 控制 的 分 布 式 特 性 ， 你 
可 以 将 其 与 第 1 章 的 图 1-17 比 较 。 
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图 13-12 
注 : 拥塞 控制 是 以 分 布 式 的 方式 来 完成 的 ， 每 个 终端 主机 都 通过 负 反馈 控制 窗口 大 
小 


最 后 ， 让 我 们 从 头 到 尾 分 析 TCP 韦 加 斯 的 一 个 例 了 于。 为 简单 起 见 ， 
假设 最 小 往返 时 间 从 未 改变 ， 固 定 在 50 坚 秒 。 现 实情 况 并 非 如 此 ， 发 送 
端 将 基于 先前 测量 值 的 动态 调整 这 一 最 小 值 。 我 们 也 会 把 时 间 单 位 看 成 
数据 包 确 认 到 达 的 时 间 ， 所 以 每 一 步 都 对 应 一 次 窗口 大 小 更 新 。 


当 会 话 建立 ， 假 设 和 里 诺 的 例子 一 样 ， 友 送 端 开始 的 窗口 大 小 为 


。 最初， 终端 主机 发 出 5 个 数据 包 ， 然 后 停顿 。 
。 在 时 间 1， 第 一 个 数据 包 返 回 ， 往 返 时 间 为 51 毫 秒 。 目 前 吞 
吐 量 为 : 
5 包 / 51 毫秒 = 98. 03 包 / 秒 


无 拥塞 吞吐 量 为 : 
5 包 / 50 坚 秒 = 100 包 / 秒 


差 值 为 100 - 98.03 = 1.97， 小 于 3， 所 以 窗口 大 小 增加 1 至 6。 由 于 现 


在 有 4 个 未 完成 数据 包 ， 因 此 终端 主机 会 再 发 送 两 个 ， 共 计 6 个 。 你 可 以 
在 图 13-13 中 看 到 。 


窗口 = $ 
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图 13-13 


注 : 当 拥塞 窗口 大 小 增加 时 ， 终 端 主 机 再 发 出 两 个 数据 包 ， 比 上 个 数据 包 回 来 之 前 
多 一 个 


时 间 


。 第 二 个 数据 包 在 时 间 2 返 回 ， 往 返 时 间 为 50.5 毫 秒 。 吞 吐 量 
是 多 少 ? 目前 吞吐 量 为 6 包 / 50.5 毫 秒 = 118. 81 包 / 秒 ， 而 无 拥塞 吞 
吐 量 为 6 包 / 50 毫 秒 = 120 包 / 秒 。 差 值 为 120 - 118.81 = 1.19， 同 
样 小 于 3。 窗 口 大 小 增加 到 7， 再 次 发 送 两 个 数据 包 。 

。 在 时 间 3 和 4， 第 三 个 和 第 四 个 数据 包 返 回 。 假 设 它们 的 往返 
时 间 又 使 窗口 大 小 增加 。 然 后 ， 窗 口 大 小 将 变 成 9。 

。 ”在 时 间 5， 第 五 个 数据 包 的 往返 时 间 为 50. 8 毫秒 ， 这 使 得 当 
前 吞吐 量 为 9 包 / 50. 8 毫秒 六 177 包 / 秒 ， 无 拥塞 吞吐 量 为 9 包 / 50 毫 
秒 = 180 包 / 秒 。 差 值 大 约 为 3， 所 以 窗口 大 小 保持 不 变 ， 终 端 主机 发 


送 一 个 数据 包 。 你 可 以 在 图 13 - 14 中 看 到 这 个 滑动 窗口 。 

。 在 时 间 6， 第 六 个 数据 包 返 回 ， 往 返 时 间 为 51. 8 毫秒 。 吞 吐 
量 是 多 少 ? 目前 是 9 包 / 51. 8 毫秒 = 173.7 包 / 秒 ， 而 无 拥塞 吞吐 量 和 
以 前 一 样 ， 为 180。 差 值 180 - 173.7 = 6.3,， 现在 大 于 3。 因 此 ， 
窗口 大 小 减 小 到 8， 没 有 数据 包 被 发 送 ( 见 图 13 -15) 。 


本 一 

剖 四 醒 

MV 窗口 -5 (保持 不 变 ) | 
和 
i 


未 完成 | 


接收 
差 值 = 阅 值 


图 13-14 
注 : 当 拥 塞 窗口 大 小 不 变 ， 终 端 主机 会 发 出 一 个 数据 包 


时 间 


窗口 = 5 


-| 
12|131415 
4 


窗口 =4 (增加 ) 
i 
mr 


接收 
差 值 一 阅 值 


图 13-15 
注 : 当 拥 塞 窗口 大 小 减少 ， 终 端 主机 不 会 发 送 任何 数据 包 


这 些 往返 时 间 中 每 一 个 的 拥 窄 窗 口 及 其 之 后 可 能 如 何 变 化 ， 如 图 
13-16 所 示 。 如 果 你 对 时 间 7~13 中 导致 这 种 行为 的 原因 感 兴趣 ， 请 参考 
本 书 网 站 Q13.3 部 分 。 其 中 有 明显 的 上 升 、 平 稳 、 下 降 、 平 稳 、 上 升 等 
模式 ， 和 我 们 在 第 1 章 功 率 控 制 的 例子 〈 见 图 1-16) 中 看 到 的 传输 功率 
水 平 类 似 。 我 们 预计 会 出 现 这 种 基于 延迟 的 拥 春 控 制 行为 : 如 果 网 络 没 
有 得 到 充分 利用 ， 往 返 时 间 太 短 ， 就 表示 终端 主机 可 以 发 送 更 多 数据 
包 。 如 果 网 络 使 用 过 度 ， 往 返 时 间 太 长 ， 束 次 明 终端 主机 应 该 减少 发 
送 。 当 差 值 和 靖 值 相同 ， 窗 口 大 小 束 不 会 改变 ， 就 像 处 于 分 布 式 功率 控 
制 下 的 手机 在 得 到 其 所 需 的 信号 干扰 比 时 ， 不 会 改变 其 传输 功率 一 样 。 
负 友 馈 是 强大 的 ! 


时 间 


确认 
图 13-16 
注 : 通过 TCP 韦 加 斯 ， 对 于 每 个 接收 到 的 确认 ， 窗 口 大 小 增加 1， 减 少 1， 或 保持 不 变 


作为 这 些 算 法 行为 的 总 结 ， 图 13-17 显 示 了 随 着 时 间 的 推移 ，TCP 
里 诡 和 TCP 韦 加 斯 拥 窟 窗口 大 小 的 典型 变化 。 你 可 以 看 到 ，TCP 里 诡 采 
用 基于 丢失 的 信号 ， 不 断 重 复 上 升 至 过 于 激进 的 速率 〈 导 致 网 络 链 路 拥 
蹇 ) 又 乘法 式 下 降 到 较 低 水 平 “ 导 致 网 络 资源 利用 不 足 ) 的 过 程 。 当 我 
们 使 用 基于 延迟 的 拥塞 控制 算法 TCP 韦 加 斯 时 ， 这 种 “ 饥 齿 ”一 般 会 减少 
并 变 得 平滑 。 丢 失 是 二 元 “是 或 否 ” 的 信号 ， 而 延迟 往往 让 我 们 更 加 快速 
和 平滑 地 对 拥 墙 做 出 反应 ， 只 要 算法 的 参数 调整 恰当 。 


窗口 窗口 
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图 13-17 


注 : TCP 里 诺 和 TCP 韦 加 斯 拥塞 窗口 值 的 典型 模式 。 里 诺 中 网 络 资源 过 度 利 用 和 利用 
不 足 之 间 的 锯 苍 往往 在 书 加 斯 中 变 得 更 小 、 更 平滑 

在 前 面 三 章 ， 我 们 讨论 了 互联 网 背后 的 一 些 显 车 的 知识 形势 。 我 们 
开始 了 解 其 设计 背后 的 三 个 基本 概念 : 分 组 交换 、 分 布 式 层次 结构 和 模 
块 化 。 然 后 ， 我 们 详细 讨论 了 互联 网 需要 处 理 的 两 个 主要 功能 : 路 由 ， 
通过 网 络 内 逐 跳 实 现 ;， 拥 考 控 制 ， 由 网 络 边缘 的 设备 通过 端 到 端 实现 。 
作为 协议 栈 的 “ 细 腰 ”，TCP/AP 将 下 面 的 功能 模块 《如 物理 层 和 链接 层 ) 
与 上 面 的 模块 《如 应 用 层 ) 粘连 起 来 。 作 为 细 腰 的 一 部 分 ，TCP 的 拥塞 
控制 设计 和 了 王 的 路 由 设计 带 来 了 巨大 的 成 功 。 尽 管 互联 网 在 地 域 分 布 中 
不 断 增 长 ， 处 理 的 功能 越 来 越 多 ， 应 对 的 需求 不 断 增 加 ， 但 互联 网 仍然 
没有 骨 溃 ， 这 都 要 归功 于 这 些 能 力 。 


这 里 的 目标 不 是 掌握 数学 模型 或 工程 细节 。 对 于 那些 ， 有 完整 的 课 
程 甚至 整个 学 位 谍 程 项 目 专 门 针 对 协议 栈 中 的 层 。 相 反 ， 我 们 想 强 调 互 
联网 背后 的 基本 原则 ， 以 及 路 由 和 拥 窟 控制 如 何 工作 。 


第 14 章 
在 小 世界 中 航行 


互联 网 及 其 推动 的 社交 网 络 是 巨大 的 ， 我 们 每 个 人 只 直接 连接 到 其 
中 一 小 部 分 。 正 如 我 们 在 第 10 章 中 看 到 的 ，2015 年 ， 普 通 脸 书 用 户 只 跟 
网 站 上 的 16.5 亿 人 中 的 大 约 350 人 是 “好 友 ”。 但 陌生 人 往往 可 以 通过 很 小 
的 短路 径 进 行 连接 。 脸 书 中 两 个 人 之 间 的 平均 分 离 度 不 超过 四 跳 。 在 网 
络 相 对 两 端的 人 之 间 ， 怎 么 会 自然 存在 这 么 短 的 端 到 端 路 径 ? 正如 我 们 
将 看 到 的 ， 这 取决 于 社会 网 络 的 组 织 方 式 以 及 人 们 搜索 短 距 离 的 方式 。 


毕竟 这 是 一 个 小 世界 


1967 年 ， 美 国 社会 心理 学 家 斯 坦 利 : 米 尔格 拉 姆 进行 了 一 项 实验 ， 
揭 开 小 世界 (small-world) 现象 的 序幕 ， 这 或 许 被 更 广泛 地 称 为 “六 
度 分 隔 理 论 ” (six degrees of separation) 。 它 已 成 为 科普 书籍 中 
的 一 个 流传 最 广泛 ， 有 时 也 会 被 误解 的 故事 。 


为 什么 是 六 度 ? 


米尔 格拉 姆 让 生活 在 奥马 哈 《〈 灶 国 中 西部 的 内 布 拉 斯 加 州 最 大 的 城 
市 ) 的 300 个 人 ,将 一 封 看 上 去 像 护 照 的 信 传 递 给 一 个 生活 在 东海 尾 马 
院 诸 窟 州 波 士 顿 部 区 的 人 。 收 信人 的 姓名 、 地 址 和 职业 股票 经 纪 人 人 ) 
显示 在 信封 上 。 米 尔格 拉 姆 癌 参 与 者 提出 一 条 重要 的 规则 : 他 们 只 能 把 
信和 转交 给 自己 认识 并 知道 名 字 的 人 。 因 此 ， 如 果 他 们 不 认识 收 件 人 并 知 
道 名 字 几乎 没有 人 知道 ) ， 束 只 能 通过 别人 来 寄 信 ， 首 先 把 信 交 给 一 


个 朋友 《一 跳 ) ， 然 后 对 方 交 给 目 己 的 一 个 朋友 《又 一 跳 ) ， 直 到 信和 最 
终 传 到 某 个 知道 该 股票 经 纪 人 名 字 的 人 手 上 。 米 尔格 拉 姆 想 知 道 ， 这 个 
过 程 将 经 过 多 少 跳 ? 


可 以 想象 ， 知 道 收 信 人 的 姓名 和 地 址 在 本 实验 中 是 很 重要 的 。 有 了 
这 些 信息 ， 人 们 可 以 分 析 :“ 咽 ， 我 不 认识 收 信人 人 本人， 但 我 认识 一 个 
住 在 波士顿 附近 的 人 ， 所 以 我 会 转交 给 他 。” 事 实证 明 ， 知 道 收 信人 的 
只 业 也 发 挥 了 重要 作用 ， 这 样 就 可 以 把 信 交 给 与 他 相同 或 相似 职业 的 
人 。 你 可 以 猜 到 ， 这 些 信件 经 过 的 路 径 往往 会 看 起 来 像 图 14-1: 几 条 远 
程 链接 把 信 传 到 收 信 人 附近 ， 还 有 几 条 短 距离 链接 基于 更 具体 的 本 地 决 
策 ,“ 距 离 ” 成 为 地 理 和 职业 传播 的 茶 种 组 合 。 从 源 必 出 的 远程 链接 之 后 
是 到 目的 地 的 短程 本 地 链接 ， 这 可 能 使 你 想起 我 们 在 第 12 半 讨论 的 互联 
网 路 由 和 邮件 系统 的 类 比 ， 不 过 这 里 路 由 如 何 操作 和 评价 有 重要 的 天 


并。 


目的 地 


图 14-1 


注 : 两 个 距离 远 且 不 认识 彼此 的 人 ， 他 们 之 间 的 短路 径 可 能 包括 一 个 或 一 个 以 上 的 
远程 链接 

结果 怎样 ? 米尔 格拉 姆 提供 的 信件 中 ， 有 217 封 真正 送出 去 了 ， 其 
中 64 封 〈 约 30% ) 抵达 目的 地 。 其 他 信件 可 能 丢失 在 路 上 ， 这 一 点 在 分 
析 数 据 时 需要 认真 考虑 。21 世 纪 初 ， 有 人 利用 电子 邮件 复制 了 这 次 实 


验 ， 只 取得 1.5% 的 到 达 率 。 与 之 相 比 ， 米 尔格 拉 姆 取得 的 30% 的 成 功率 
实在 令 人 印象 深刻 。 每 一 封 信 经 过 的 不 同 跳 数 如 图 14-2 所 示 : 平均 仅 为 
5.2 跳 ， 而 中 位 数 《〈 中 间 的 数 ) 仅 为 6 跳 。 这 就 是 “六 度 ” 的 由 来 : 对 于 不 
认识 役 此 的 人 来 说 ， 这 是 非常 短 的 距离 ! 
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* 一 中 间 


出 现 次 数 


跳 数 
图 14-2 米尔 格拉 姆 的 实验 中 ， 每 封 信 到 达 目 的 地 所 经 过 的 跳 数 
注 : 中 位 《中 间 ) 数 为 6 


研究 人 员 一 直 怀 疑 ， 社 会 距离 (social _ distance) ， 或 在 人 群 中 
到 达 任何 人 所 经 过 的 平均 跳 数 ， 随 人 口 规模 增 大 而 发 生 的 增长 十 分 组 
慢 。 米 尔格 拉 姆 的 结果 对 此 提供 了 证 明 。 多 年 来 ， 许 多 人 对 他 的 实验 结 
论 提出 反对 ， 声 称 基于 不 同 的 参与 对 象 、 组 织 方式 和 其 他 自由 度 ， 实 验 
将 会 取得 不 同 结果 。 但 从 20 世 纪 70 年 代 到 在 线 社交 媒体 时 代 ， 从 研究 合 
作者 之 间 的 埃 数 到 演员 之 间 的 联合 出 演 关 系 ， 大 量 实证 研究 证 据 表 明 小 
世界 现象 的 存在 。 其 他 大 型 研究 也 将 平均 跳 数 确定 为 6 或 大 约 6 次 ， 如 邓 
肯 沃 次 在 2001 年 利用 电子 邮件 进行 的 实验 ， 以 及 2008 年 对 微软 
Messenger 用 户 之 间 即 时 信息 的 研究 。 


2016 年 2 月 ， 脸 书 用 户 之 间 的 分 隔 度 仅 为 3.57， 而 2011 年 为 4.74， 
2008 年 为 5.28。 显 然 ， 我 们 已 经 很 小 的 世界 在 网 上 正 变 得 越 来 越 小 ! 


《虽然 不 是 所 有 的 脸 书 友谊 都 属于 “知道 名 字 ?” 的 友谊 。) 


小 世界 的 概念 已 经 渗透 到 流行 文化 中 ， 出 现在 电影 、 电 视 节 目 和 和 歌 
曲 中 。 一 部 名 为 “六 度 分 隔 ” 的 电影 于 1993 年 上 映 。2007 年 ， 一 家 跟 
踪 “ 六 度 的 凯 文 : 贝 表 ”的 网 站 (http://oracleofbacon.org/movielinks.php) 
成 立 。 它 基于 一 个 理念 : 好 羔 坞 电影 业 中 的 任何 人 都 可 以 通过 其 电影 角 
色 与 这 位 多 产 的 演员 产生 联系 。2015 年 ， 电 视 节 上 日 《六 度 的 一 切 》 首 
映 ， 其 前 提 是 ， 主 持 人 可 以 在 六 个 步骤 以 内 ， 与 人 、 事 物 或 两 者 都 产生 
联系 。 对 于 当今 最 有 趣 的 科普 主题 之 一 ， 这 些 只 是 你 可 以 找到 的 多 个 例 
3 


小 世界 奇怪 吗 ? 


对 于 社会 网 络 中 看 似 普 遍 的 小 世界 理论 ， 我 们 应 该 感到 惊讶 吗 ? 表 
面 上 ， 你 可 以 在 六 个 或 更 少 步骤 以 内 联系 到 任何 人 ， 这 似乎 很 令 人 惊 
叹 。 再 想 想 ， 你 可 能 做 出 如 下 分 析 : 如 果 你 有 20 个 朋友 ， 他 们 每 个 人 都 
有 20 个 朋友 ， 以 此 类 推 ， 那 么 你 在 六 步 以 内 可 以 联系 到 
20x20x20x20x20x20 = 6 400 万 个 人 。 按 照 这 个 逻辑 ， 一 般 情 况 下 六 步 应 
该 足够 。 


但 这 个 逻辑 有 一 个 缺陷 ， 因 为 它 假定 人 们 的 朋友 不 会 彼此 重 登 。 你 
需要 你 的 每 一 个 朋友 有 20 个 朋友 ， 其 中 不 包括 你 的 任何 其 他 朋友 ， 也 不 
包括 他 们 的 朋友 。 现 实 显然 不 是 这 样 的 ， 社交 网 络 充满 了 “三 角形 ”或 三 
角 闭 合 (triad closures) 的 关系 。 你 可 以 在 图 14-3 中 看 到 三 角 闭 合 的 
一 个 例子 : 如 果 安 娜 和 本 都 认识 查理 ， 很 可 能 他 们 也 认识 对 方 。 


查理 


安娜 本 


图 14--3 
注 : 如 果 安 娜 和 本 都 认识 查理 ， 很 可 能 他 们 也 认识 对 方 。 如 果 确 实 如 此 ， 这 种 关系 
成 为 一 个 三 角 闭 合 关系 
六 度 分 隅 现在 确实 令 人 尺 讶 。 但 米尔 格拉 姆 式 的 小 世界 实验 表明 更 
为 有 力 的 观点 : 这 些 短路 径 不 仅 存 在 ， 每 个 人 还 可 以 利用 关于 目的 地 非 
第 有 限 的 信息 及 其 自身 的 本 地 网 络 视图 上 友 现 它们 。 与 第 12 章 通过 网 络 发 
送 数据 包 相 比 ， 这 种 社会 化 搜索 (social search) 过 程 也 许 更 难 ， 
为 人 们 并 不 是 经 过 编程 来 传递 消息 以 帮助 彼此 建立 全 局 视 网 。 他 们 拥有 
的 唯一 有 用 的 信息 散 入 在 收 信 人 的 地 址 和 职业 中 ， 可 能 也 在 收 信人 的 姓 
名 中 ， 这 可 能 会 揭示 一 些 关 于 其 性 别 和 种 族 的 有 用 信息 。 这 全 少 可 以 提 
供 一 些 关 于 收 信 人 在 网 络 哪 “ 端 ”的 局 示 。 


根据 这 些 信 息 ， 也 许 这 些 实 验 的 参与 者 会 构建 其 联系 人 和 收 信人 之 
闻 的 距离 度量 指标 。 例 如 ， 以 英里 测量 地 理 距 离 ， 纽 约 比 芝 加 哥 更 靠近 
波士顿 。 同 样 ， 按 照 茶 些 职业 距离 指标 ， 财 务 顾问 可 能 比 护士 更 接近 股 
票 经纪 人 。 这 个 指标 更 模糊 ， 但 可 以 进行 合理 量化 。 如 果 每 个 人 真 的 基 


于 局 部 视图 ， 用 简单 而 “ 贫 攀 ”的 算法 来 将 信和 转交 给 最 接近 目的 地 的 朋 
友 ， 这 会 产生 一 条 最 短路 径 吗 ? 


总 结 一 下 ， 小 世界 现象 包括 两 个 部 分 : 


。 结构 方面 : 社会 网 络 可 以 以 最 初 存在 短路 径 的 方式 形成 。 


算法 方面 : 利用 非常 有 限 的 本 地 信息 ， 人 能 找到 一 条 这 样 的 
短路 径 。 


多 年 来 ， 人 们 构建 了 各 种 异型 来 解释 这 两 种 小 世界 。 在 本 章 的 其 余 
部 分 ， 我 们 将 介绍 其 中 最 受 欢 迎 的 一 种 。 


个 步骤 是 合理 的 


>: 


我 们 如 何 建立 一 个 图 表 来 显示 小 世界 ? 建 模 将 帮助 我 们 理解 网 络 的 
样子 ， 它 在 一 开始 就 产生 这 种 现象 。 我 们 需要 一 种 方式 来 获得 较 小 的 路 
径 长 度 ， 同 时 保持 一 个 真实 的 网 络 结构 。 


短 距离 


在 本 书 中 ， 我 们 已 经 看 到 几 个 描述 网 络 的 指标 ， 从 网 络 拥 有 的 节点 
和 链接 数量 等 简单 指标 ， 到 不 同 中 心性 等 更 为 复杂 的 指标 。 用 来 总 结 图 
中 最 短路 径 的 一 个 常用 指标 是 其 直径 (diameter) ， 这 是 网 络 中 任何 
一 对 节点 之 间 最 长 的 最 短路 径 的 长 度 。“ 最 长 的 最 短 ” 可 能 听 起 来 很 奇 
怪 : 要 确定 这 个 长 度 ， 我 们 找 出 所 有 节点 对 之 间 的 最 短路 径 长 度 ， 然 后 
选择 其 中 最 长 的 。 


如 果 直 径 相 对 网 络 中 市 点 的 数量 较 小 ， 这 将 给 我 们 提供 找 出 小 世界 
路 径 长 度 方 面 所 需要 的 信息 。 但 其 实 这 对 于 我 们 这 里 的 目的 有 些 极端 : 


当 我 们 想到 小 世界 时 ， 我 们 更 关心 的 是 最 短路 径 的 平均 值 ( 记 住 ，6 是 
图 14-2 中 的 中 位 数 ) 。 如 果 一 张 图 的 最 短路 径 长 度 刚 好 是 1、1、2、2、 
2、3、4、5， 那 么 直径 是 5， 它 告诉 我 们 所 有 节点 对 中 的 最 坏 情 况 ， 而 
平均 数 (2.5) 或 中 位 数 (2) 能 对 小 世界 情况 进行 更 好 的 总 结 。 你 可 能 
还 记得 ， 我 们 在 第 10 章 使 用 所 谓 的 平均 最 短路 径 长 度 ， 计 算 接近 中 心性 
指标 。 


图 14-4 
注 : 一 个 小 例 图 ， 用 来 计算 两 个 指标 : 平均 最 短路 径 距 离 和 聚集 系数 


让 我 们 找 出 图 14-4 中 小 型 网 络 的 这 个 长 度 是 多 少 。 第 一 步 是 找到 所 
有 的 最 短路 径 长 度 。 从 节点 A 开始 ， 从 A 到 B 的 路 径 长 度 是 多 少 ? 有 一 条 
直接 的 链接 ， 最 短路 径 长 度 为 1。 从 A 到 C 呢 ?同样 ， 最 短路 径 是 一 条 直 
接 的 链接 。 对 于 A 到 D， 我 们 必须 经 过 路 径 (A，C，D) ， 其 长 度 为 2。 
从 A 到 E 呢 ? 它 经 过 路 径 (A，C，E) ， 其 长 度 也 为 2。 你 可 以 按照 这 个 
逻辑 ， 找 出 以 下 最 短路 径 的 长 度 :， 从 B 到 C (1) ，B 到 D (2) ，B 到 
E (2) ; 从 C 到 D (1) ，C 到 E (1) ;， 从 D 到 E (1) 。 在 这 10 对 节点 
中 ， 平 均 最 短路 径 长 度 为 : 


l+ 1+2+2+1+2+2+1+1+1 14_ 
10 10 


1.4 


这 个 数字 说 明 什 么 ? 在 明智 地 选择 路 径 后 ， 一 个 人 可 以 通过 平均 


1.4 步 到 达 男 一 个 节点 。 这 个 例子 非常 直观 ， 因 为 图 中 只 有 5 个 节点 ， 最 
短路 径 的 长 度 为 1 或 2。 随 着 市 把 数 量 增长 ， 知 道 这 个 长 度 是 很 重要 的 ， 
其 价值 可 能 会 令 人 惊讶 。 


那么 ， 什 么 样 的 网 络 即使 有 很 多 节点 ， 其 平均 最 短路 径 长 度 也 会 相 
对 较 小 ? 


随机 


想象 一 组 还 没有 和 链接 的 节操。 然后 有 人 一 个 接 一 个 地 经 过 每 个 节操 
对 ， 以 0 到 100% 之 间 的 茶 个 固定 概率 在 它们 之 间 建 并 链接。 和 直观 地 说 ， 
这 个 概率 越 高 ， 你 就 会 看 到 更 多 链接 。 你 可 以 在 图 14-5 中 看 到 一 些 顷 
果 : 在 左边 ， 链 接 建 立 的 概率 只 有 10%， 所 以 只 有 一 小 部 分 链接 建立 。 
随 着 它 在 右边 增加 到 50%， 更 多 链接 被 建 六 ， 在 这 种 情况 下 ， 大 约 一 半 
的 节点 对 是 直接 连接 的 。 链 接 数量 预计 将 和 概率 成 正比 。 


10% 25% 


图 14-5 
注 : 随机 图 按照 一 定 概率 在 两 个 节点 之 间 建 立 链 接 。 随 着 这 一 概率 增加 ， 网 络 预计 
将 有 更 多 的 链接 
随机 图 (random graph) 惑 是 这 样 建立 的 。 随 机 图 使 最 短路 径 
长 度 始 终 很 小 ， 因 为 连接 网 络 两 端 节 点 的 远程 链接 是 可 能 的 ， 而 只 要 几 
条 远程 链接 ， 我 们 就 可 以 大 大 降低 最 短路 径 的 间距 。 然 而 ， 这 种 网 络 形 
成 过 程 听 起 来 很 不 现实 。 它 就 好 比 找 一 堆 彼此 不 认识 的 人 ， 拒 他 们 放 在 


一 个 房间 里 ， 并 让 他 们 随机 决定 是 否 成 为 朋友 一 样 。 这 很 可 能 不 会 发 
生 ， 并 且 绝 对 不 是 一 种 建立 联系 的 目 然 方式 。 


朋友 的 三 角形 
除了 较 小 的 平均 距离 ， 社 会 网 络 模型 需要 有 使 朋友 的 朋友 互相 成 为 


朋友 的 趋势 。 随 机 图 不 提供 这 一 趋势 ， 但 它 是 社会 网 络 的 一 个 重要 特 
征 。 


怎么 衡量 这 个 特征 呢 ?” 通 过 使 用 所 谓 的 聚 类 系数 (clustering 
coefficient) 。 这 是 衡量 图 中 三 角 闭 合 数量 的 指标 ， 相 对 于 连接 三 元 
组 (connected triples) 总 数 ， 对 方 可 能 有 或 没有 完成 三 角形 的 最 后 
一 个 链接 。 


看 一 看 图 14-6。 连 接 三 元 组 有 哪些 ? (A，B，C) 和 (B,C, D) 
都 是 ， 尽 管 后 者 没有 从 B 到 D 的 直接 链接 。 (B,C，A) 和 (C, A， 
B) 也 是 。 把 A、B 和 C 的 三 个 连接 三 元 组 都 列 出 来 似乎 很 多 余 ， 但 其 实 
不 是 ， 因 为 每 一 条 都 是 通过 不 同 节 点 链接 的 不 同 路 径 。《〈 更 多 信息 请 参 
考 本 书 网 站 Q14.1 部 分 。) 这 些 节点 之 间 有 三 条 链接 ， 这 使 ABC 成 为 三 
角 闭 合 ， 而 BCD 不 是 。 


图 14--6 
今 一 个 三 角 闭合 和 五 个 连接 三 元 组 ， 其 聚 类 系数 为 3 / 5 


注 : 这 张 小 图 包 念 一 个 三 


图 中 的 三 角 闭 合 表 示 彼 此 认识 的 重 受 。 图 中 的 三 角 闭 合 越 多 ， 育 类 
束 越 多 。 计 算 聚 类 系数 的 具体 公式 为 : 


3 x 三 角 闭 合 
链接 三 元 组 


乘 以 3 说 明 每 个 三 角 闭 合 有 三 个 连接 三 元 组 。 这 使 得 聚 类 系数 为 
0 无 诊 类 ) 和 1《〈 完 全 聚 类 ) 之 间 的 一 个 数 。 


图 14-7 


注 : 此 图 中 除了 两 个 三 角 闭 合 ( 实 线 表示 ) ， 还 有 三 个 连接 三 元 组 (A，C，D) 、 
(A,，C, E) 、 (B，C，D) ， 这 使 聚 类 系数 为 2 / 3 


图 14-6 中 的 聚 关系 数 是 多 少 ? 它 有 一 个 三 角形 和 五 个 连接 三 元 组 : 


3x1 3 
5 -3 06 


因此 ， 图 中 当前 连接 表现 出 60% 的 聚 类 。 如 果 有 一 条 链接 从 B 到 
D， 系 数 将 增加 到 100%。 


让 我 们 回 到 图 14-4。 图 中 有 多 少 个 三 角 闭 合 ? 两 个 : ABC 和 CDE。 
有 多 少 个 连接 三 元 组 ? 每 个 三 角形 已 经 有 三 个 。 此 外 ， 该 图 有 三 个 连接 
三 元 组 (A，C，D) 、 (A,， C, E) 和 (B，C，E) ， 它 们 都 不 在 三 角 
闭合 中 。 这 些 都 在 图 14-7 中 用 虚线 标 出 ， 并 表示 非 三 角形 的 社会 联系 。 
该 图 的 聚 类 系数 为 : 


随机 图 的 聚 类 系数 往往 很 小 ， 这 就 是 为 什么 它们 不 能 解释 六 度 分 隅 
的 原因 。 “很 小 ?是 多 小 ? 简单 说 ， 对 于 一 个 随机 图 ， 上 面 的 公式 大 致 转 
化 为 ， 一 个 节操 的 平均 度数 除 以 网 络 中 的 节点 总 数 〈 请 记 住 ， 市 点 的 反 
数 是 连接 到 它 的 链接 数 ) 。 选 择 2015 年 和 2016 年 脸 书 的 数字 ， 这 个 图 中 


将 有 16.5 亿 用 户 和 平均 每 人 350 个 朋友 。 如 果 脸 书 是 一 个 随机 图 (其 实 
不 是 ) ， 那 么 它 的 聚 类 系数 大 约 是 0.000 000 2。 这 对 于 现实 中 的 社交 网 
络 来 说 太 小 了 。 


正则 环 图 


可 以 解释 小 世界 的 图 像 模型 应 该 有 两 个 主要 特征 : 一 是 较 小 的 平均 
最 短路 径 长 度 ， 二 是 较 大 的 聚 类 系数 。 


相 比 随机 模型 ， 如 果 我 们 考虑 另 一 个 极端 : 一 个 非常 规则 的 结构 ， 
如 图 14-8 所 示 ， 情 况 会 怎样 ? 这 是 正则 环 图 (regular ring graph) 
的 一 个 例子 ， 其 中 环 上 有 一 定数 量 的 节点 (此 图 中 有 8 个 ) 。 图 的 结构 
完全 由 两 个 数 决定 : 


2 链接 /节点 4 链接 /节点 


图 14-8 
注 : 包含 8 个 节点 的 正则 环 图 ， 每 个 节点 的 链接 数 不 同 。 随 着 每 个 节点 的 链接 数 增 
加 ， 聚 类 系数 也 会 迅速 增加 


。 环 上 的 节点 数 ; 


。 每 个 节点 拥有 的 链接 数 。 


两 者 都 是 偶数 ， 因 为 每 个 节点 的 链接 都 是 均匀 分 布 的 ， 一半 同 一 
边 ， 为 一 半 同 男 一 边 。 当 每 个 节点 有 两 个 链接 时 ， 图 束 变 成 一 个 纯 环 ， 
其 中 每 个 节点 只 连接 到 它 汶 边 的 节点 。 每 个 节点 有 4 个 链接 时 ， 每 个 连 
接 到 其 左边 的 两 个 近邻 以 及 右边 的 两 个 近邻 。 每 个 节点 有 6 个 链接 时 如 
何 ? 每 一 边 都 会 有 三 个 近邻 。 该 模式 将 以 这 种 方式 继续 。 


这 种 类 型 的 图 的 聚 类 系数 是 多 少 ? 对 于 每 个 节点 两 个 链接 ， 这 非常 
简单 : 由 于 没有 三 角形 ， 所 以 聚 类 系数 为 0。 如 果 我 们 把 数字 增加 到 4 会 
怎么 样 ? 现在， 以 每 个 节点 为 中 心 有 一 个 三 角 闭 合 。 在 图 14-9 的 左上 
方 ， 你 可 以 看 到 三 角形 BCD 以 节点 C 为 中 心 。 连 接 三 元 组 如 何 ? 除了 三 
角 闭 合 中 的 三 个 ， 每 个 节点 有 三 个 三 元 组 以 其 为 中 心 ， 对 于 节点 C， 
(A，C，E) 、(B，C，E) 和 (A，C，D) 可 以 在 图 14-9 的 其 他 部 分 


看 到 。 


图 14-9 


注 : 对 于 每 个 节点 有 四 个 链接 的 正则 环 图 ， 每 个 节点 将 有 一 个 三 角 闭 合 〈 左 上 ) 和 
另外 三 个 连接 三 元 组 ( 另 三 张 图 片 ) 以 其 为 中 心 

目前 共有 一 个 三 角 财 合 和 6 个 连接 三 元 组 。 我们 需要 看 其 余 的 节点 
吗 ? 不 需要 。 因 为 正则 环 图 是 对 称 的 ， 所 以 每 个 市 点 周围 的 结构 是 相同 
的 。 例 如 ， 对 于 8 个 节点 ， 有 8 个 三 角 闭 合 和 6x8 = 48 个 连接 三 元 组 ， 
此 聚 类 系数 为 : 


如 果 有 6 个 节点 昵 ? 还 是 3x6 / 36 = 1/2。 如 果 有 100 个 昵 ? 3x100 / 
600 = 1/2， 还 是 一 样 。 正 则 环 图 的 聚 类 系数 不 取决 于 节点 数量 ， 因 为 每 
个 额外 的 节点 都 会 添加 等 量 的 三 角 闭 合 和 连接 三 元 组 。 


从 每 个 节点 两 个 链接 的 0 聚 类 到 每 个 节点 4 个 链接 的 50% 聚 类 ， 这 是 
相当 巨大 的 增长 。 随 着 更 多 的 链接 被 添加 进来 ， 增 长 会 放 缓 ， 但 仍 会 继 
续 增 长 。 你 可 以 在 图 14-10 中 看 到 这 个 趋势 (如 果 你 对 具体 方程 感 兴 
趣 ， 请 参考 本 书 网 站 Q14.2 部 分 ) : 随 着 每 个 节点 的 链接 数量 变 得 非常 
大 ， 聚 类 系数 接近 正则 环 拓扑 的 最 大 值 344， 或 0.75。759% 聚 类 很 好 也 很 
大 > 到 放权 放大 了 < 
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每 个 节点 的 链接 
图 14-10 

注 : 正则 环 图 中 的 聚 类 系数 取决 于 每 个 节点 的 链接 数 。 当 链接 数 变 得 非常 大 时 ， 系 
数 接近 75% 

正则 环 图 模型 与 随机 图 模型 形成 了 鲜明 对 比 。 与 随机 图 不 同 的 是 ， 
它 的 聚 类 系数 较 高 ， 这 对 于 社会 网 络 是 很 现实 的 。 然 而 ， 由 于 每 个 节点 
只 连接 到 它 的 最 近邻 ， 因 此 只 存在 短 距 离 连接 ， 这 使 得 正则 图 有 较 大 的 


平均 最 短路 径 长 度 。 要 到 达 网 络 另 一 端的 节点 ， 必 须 穿 过 几 条 短 链接 ， 
如 图 14-11 所 示 。 


图 14--11 


注 : 没有 远程 连接 ， 正 则 环 图 将 有 较 小 的 平均 最 短路 径 长 度 。 此 图 中 有 16 个 节点 ， 
每 个 节点 有 4 条 链接 ， 需 要 4 条 链接 通过 节点 A 和 B 之 间 

如 果 我 们 不 断 增加 每 个 布点 的 链接 数量 ， 那 么 就 不 会 在 人 与 人 之 间 
建立 更 直接 的 连接 ， 从 而 使 路 径 更 短 吗 ?这 在 理论 上 是 可 行 的 ， 但 也 是 
不 现实 的 ， 因 为 逐渐 缩小 平均 长 度 会 要 求 每 个 人 都 与 人 口中 越 来 越 多 的 
部 分 联系 在 一 起 。 这 在 现实 生活 中 显然 是 不 正确 的 ， 因 为 每 个 人 都 只 是 
总 人 口中 一 小 部 分 人 的 “好 友 ”。 


图 14-12 概 括 了 正则 环 图 和 随机 图 的 差异 。 是 否 有 可 能 得 到 一 个 混 
合 图 ， 既 能 结合 这 两 种 类 型 的 属性 ， 又 能 包含 两 个 世界 最 好 的 部 分 一 一 
较 大 的 聚 类 系数 和 较 小 的 平均 最 短 距离 ? 如 果 我 们 能 做 到 这 一 点 ， 也 许 
能 够 解释 为 什么 “六 度 ” 会 出 现 。 


随机 图 正则 环 图 


较 小 平均 最 短 中 离 。 钢 sl 较 大 平均 最 短 中 离 和 | 
较 小 聚 类 系数 “和 较 大 聚 类 系数 @| 
图 14-12 


注 : 正则 环 图 模型 和 随机 图 模型 的 平均 最 短路 径 长 度 和 聚 类 系数 形成 鲜明 对 比 
正则 加 上 随机 : 沃 次 -斯 托 加 次 模型 


让 我 们 考虑 一 下 实际 情况 。 一 方面 ， 我 们 需要 较 大 的 聚 类 系数 。 正 
则 图 正好 提供 。 为 一 方面 ， 我 们 需要 一 些 远 程 链接 来 减少 图 的 两 端 之 间 
的 距离 。 那 么 ， 如 果 我 们 在 相反 的 节点 之 间 诺 加 几 个 链接 呢 ? 


这 是 沃 茨 -斯 托 加 茨 模 型 (Watts-Strogatz model) 背后 的 基本 
思想 ， 它 由 邓肯 沃 次 和 史 带 芬 - 斯 托 加 获 于 1998 年 在 《自然 》 杂 志 上 发 
表 的 论文 中 首先 提出 。 该 模型 对 拥有 较 大 聚 类 系数 的 小 世界 网 络 进行 了 
非常 直观 的 解释 。 


沃 菊 - 斯 托 加 茨 图 看 起 来 像 图 14-13。 要 建立 该 模型 ， 我 们 需要 先 建 
立 一 个 正则 环 ， 其 中 每 个 节点 都 有 合理 的 链接 数 ， 然 后 在 节点 之 间 随 机 
添加 一 些 远 程 链接 。 这 些 随机 链接 通过 在 正则 环 图 中 穿 过 每 一 个 链接 ， 
并 且 在 一 些 随机 节点 对 之 间 按 照 一 定 概 率 建立 链接 而 产生 。 


图 14--13 


注 : 沃 英 -斯 托 加 英模 型 在 正则 环 图 中 添加 随机 链接 ， 或 者 是 远 距 离 链接 。 每 当 有 
短 距 离 链接 存在 时 ， 就 有 机 会 建立 远 距 离 链 接 ， 来 随机 连接 两 个 节点 


关键 是 ， 只 要 “一 点 点 "这些 额外 的 链接 ， 我 们 就 可 以 保持 较 大 的 正 
则 环 图 聚 类 系数 ， 同 时 实现 小 世界 效应 。 少 量 随 机 化 操作 可 以 大 大 减少 
平均 最 短路 径 距 离 。 当 然 ， 随 机 加 入 远 距 离 链 接 会 降低 聚 类 系数 ， 因 为 
它 会 增加 连接 三 元 组 的 数量 ， 并 很 可 能 不 会 创建 更 多 的 三 角 闭 合 。 


我 们 需要 多 少 随机 化 操作 来 减少 距离 ， 以 及 在 仍然 保持 聚 类 系数 的 
同时 ， 我 们 可 以 容忍 多 少 ? 事实 证 明 ， 只 要 链接 建立 的 概率 很 小 (例如 


约 10%) ， 对 聚 类 系数 的 影响 将 几乎 可 以 忽略 不 计 ， 但 平均 最 短路 径 距 
离 将 急剧 减少 。 你 可 以 在 图 14-14 中 看 到 这 种 行为 ， 其 中 我 们 对 于 不 同 
链接 建立 的 概率 ， 多 次 建立 沃 次 -斯 托 加 次 模型 《总 共 包 含 600 个 节点 ， 
每 个 节点 有 6 个 链接 ) ， 并 绘制 聚 类 系数 和 平均 最 短路 径 长 度 的 最 终 杰 
化 情况 〈 除 以 其 最 大 值 ， 将 纵 轴 限制 在 0 和 100% 之 间 ， 以 进行 赋 范 比 
较 ) 。 当 概率 在 1%~10% 的 范围 内 时 ， 距 离 较 小 ， 系 数 较 大 ， 这 是 现实 
中 的 小 世界 图 所 需要 的 。 
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图 14-14 
注 : 当 沃 英 -斯 托 加 英 图 中 建立 链接 的 概率 很 小 〈 例 如 1% 10%) ， 聚 类 系数 几乎 没 
ws， 但 平均 最 短 距 离 则 会 大 幅 减少 。 该 模型 就 是 这 样 产生 具有 较 大 聚 类 系数 的 
为 什么 随机 建立 链接 会 使 平均 最 短 距离 大 幅 减 少 ， 但 又 不 太 影 响 聚 
类 系数 ?本 质 在 于 我 们 对 度量 标准 的 定义 。 一 方面 ， 最 短路 径 是 极 值 测 
度 : 我 们 只 关心 两 个 节点 之 间 的 最 短 距 离 ， 所 以 不 需要 减少 所 有 路 径 的 
长 度 。 我 们 只 需要 添加 一 些 远程 链接 ， 即 使 随机 添加 ， 最 短路 径 也 将 大 
大 缩小 。 另 一 方面 ， 聚 类 系数 是 平均 值 : 它 由 三 角形 总 数 除 以 图 中 的 连 
接 三 元 组 总 数 得 出 ， 加 入 一 小 部 分 非 三 角形 连接 三 元 组 并 不 真正 影响 聚 


类 系数 。 


这 就 是 有 较 大 聚 类 系数 的 小 世界 的 神奇 之 处 : 我 们 与 大 多 数 朋 友 有 
三 角 闭 合 的 关系 ， 但 还 有 很 小 一 部 分 朋友 在 我 们 的 正常 社交 交 之 外 。 米 
尔格 拉 姆 当初 需要 用 来 分 析 六 度 分 隔 的 ， 惑 是 这 很 小 一 部 分 的 远程 链 
接 。 


在 了 解 小 世界 的 结构 方面 之 后 ， 我 们 现在 转 加 该 现象 的 第 二 个 ， 也 
是 更 令 人 惊讶 的 部 分 :人们 如 何 能 够 及 现 最 短路 任 。 


更 重要 的 : 六 个 步骤 甚至 能 在 局 部 发 现 


我 们 不 蔡 要 问 : 为 什么 最 短路 径 是 用 极 值 进行 衡量 的 ， 而 聚 类 系数 
古 以 平均 值 来 衡量 ? 相 比 于 找到 所 有 市 点 之 间 的 最 短路 径 ， 我 们 不 应 该 
还 要 找到 平均 路 径 长 度 吗 ? 人 们 普遍 认为 没 必 要 平均 。 对 于 图 中 的 任意 
两 个 节点 ， 只 要 存在 一 条 短路 径 就 足够 了 ， 因 为 节点 可 以 使 用 此 路 径 进 
行 通 信 。 如 果 其 他 路 径 不 会 被 使 用 ， 束 没有 理由 保证 所 有 路 径 都 是 短 
的 。 


但 我 们 必须 确保 人 们 能 真正 找到 这 样 一 条 路 径 。 这 个 社会 搜索 的 过 
程 并 不 总 是 容易 的 : 人 们 不 知道 网 络 结构 ， 所 以 如 果 他 们 没有 直接 连接 
到 其 目的 地 ， 那 么 束 很 难 确定 下 一 步 该 去 哪里 。 你 可 以 在 图 14-15 中 看 
到 一 个 例子 : 如 果 A 和 C 要 从 网 络 的 两 端 进行 交流 ， 它 们 怎么 会 知道 ， 
它们 有 一 个 可 以 通过 的 共同 近邻 B? 


图 14-15 
注 : 在 此 沃 蒋 -斯 托 加 英 图 中 ， 有 几 条 远程 链接 。 从 A 到 C 存 在 一 条 短路 径 〈A，B， 


C) 。 但 A 如 何 知道 这 条 短路 径 是 什么 ， 或 者 它 是 否 存 在 呢 


正如 我 们 在 第 12 章 互联 网 部 分 看 到 的 ， 被 称 为 路 由 器 的 设备 基于 其 
局 部 视图 ， 回 役 此 传递 信息 ， 使 其 能 够 找到 癌 哪 里 发 送信 息 ， 将 其 放 在 
最 短路 径 中 。 这 种 类 型 的 路 由 不 会 发 生 在 社交 网 络 中 。 所 以 问题 依然 存 
在 : 在 米尔 格拉 姆 式 的 实验 中 ， 人 们 如 何 能 够 找到 最 短路 径 呢 ? 


仿 禁 社会 搜索 


如 果 你 是 那些 参与 米尔 格拉 姆 实验 的 人 之 一 ， 或 者 是 这 些 人 开辟 的 
路 径 上 的 人 之 一 ， 你 会 如 何 仅 赁 收 信人 的 姓名 、 地 址 和 职业 ， 就 决定 最 
佳 的 下 一 跳 ? 你 可 能 会 考虑 到 地 理 距离 (比较 容易 看 到 )〉 和 职业 距离 
(比较 难 确定 〉 的 茶 些 组 合 ， 想 出 一 个 “社会 距离 *”。 然 后 你 会 看 看 你 知 


道 名 字 的 朋友 们 ， 并 基于 此 距离 ， 挑 一 个 特点 最 接近 收 信 人 的 朋友 。 


这 是 贪 禁 社 会 搜索 (greedy social search) 的 理念 ， 即 人 们 会 根 
据 其 本 地 信息 做 出 发 送信 息 的 最 好 决定 。 所 以 如 果 节 点 A 要 到 节点 Z， 
他 会 看 看 所 有 的 近邻 ， 并 确定 发 送 给 谁 最 合适 。 然 后 ， 下 个 节点 《如 
B) 会 看 看 Z 的 特点 ， 确 定 发 送 给 谁 。 然 后 下 个 节点 (如 C) 会 采取 同样 
行为 ， 直 到 消息 最 后 到 达 Z。 当 然 ， 这 种 方法 并 不 总 是 会 发 现 最 佳 的 路 
由 ， 因 为 没 人 有 网 络 的 全 局 视图 ， 但 它 往 往 是 够 用 的 。 你 可 以 在 图 14- 
16 中 看 到 它 的 一 个 例子 ， 其 中 凯特 经 过 路 径 〈(K，A，B，S) 到 达 苏 
珊 ， 但 最 短路 径 实际 上 是 (K，C，S) 。 凯 特 运行 贪 梦 搜索 来 确定 ， 相 
比 于 她 的 其 他 任何 近邻 ， 在 加 州 帕 洛 阿 尔 托 的 政治 家 爱丽 丝 更 “接近 ”在 
华盛顿 州 西雅图 的 一 位 律师 。 然 后 爱丽 丝 转 发 给 旧金山 的 政治 家 鲍 动 ， 
对 方 恰 好 认识 苏 珊 。 事 实 上 ， 碰 巧 她 在 新 泽 西 州 萨 米 特 的 一 位 精算 师 朋 
友 碍 理 与 苏 珊 有 直接 联系 。 


在 这 个 贪 焚 搜 索 过 程 中 发 现 的 平均 长 度 接近 平均 最 短路 径 长 度 吗 ? 
我 们 希望 如 此 ， 如 图 14-16 所 示 的 情况 (2 不 比 3 小 很 多 ) 。 如 果 是 这 
样 ， 那 么 我 们 可 以 说 ， 短 路 径 除 了 是 合理 的 ， 还 是 可 以 发 现 的 。 在 过 去 
15 年 里 ， 除 了 最 初 的 沃 次 -斯 托 加 次 模型 ， 多 个 社会 搜索 模型 都 对 这 个 
问题 给 出 肯定 回答 。 如 果 你 对 此 感 兴 趣 ， 请 参考 本 书 网 站 Q14.3 部 分 。 
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图 14-16 


注 : 如 果 没 有 网 络 的 全 局 视图 ， 每 个 人 都 可 能 进行 贪 禁 社会 搜索 ， 以 确定 一 条 到 目 
的 地 的 路 径 。 这 种 策略 并 不 总 会 发 现 最 佳 的 路 由 ， 但 布 望 是 ， 所 发 现 的 路 径 长 度 至 
少 会 接近 最 短 的 长 度 


忆 之 ， 事 实证 明 ， 通 过 六 个 或 更 少 步 又 连接 我 们 的 世界 是 合理 的 。 
通过 分 布 式 人 体 路 由 ， 可 以 从 网 络 的 一 端 到 男 一 端 友 现 这 些 步 又 。 


第 六 部 分 
Ra 2 二 


/AN 二 口 


终端 主机 智能 是 出 现在 各 种 网 络 应 用 中 的 一 个 重要 原则 。 互 联网 
经 常 遵循 端 到 端的 设计 ， 让 终端 主机 负责 建立 、 维 护 和 控制 会 话 ， 而 
网 络 本 身 只 负责 逐 跳 传输 数据 包 。 在 本 书 的 最 后 一 部 分 ， 我 们 首先 研 
究 了 每 台 传输 设备 的 传输 层 如 何 控制 互联 网 上 的 拥塞 ， 使 用 由 接收 端 
提供 的 反馈 消息 来 推断 网 络 条 件 和 调节 对 链接 容量 的 需求 。 然 后 我 们 
了 解 到 ， 由 于 人 们 仅 赁 本 地 信息 就 能 发 现 到 达 网 络 另 一 端的 其 他 人 的 
短路 径 ， 因 此 这 样 大 而 不 断 增 长 的 网 络 仍 然 是 小 世界 。 


本 书 主 要 叙述 了 网 络 六 条 原则 一 一 分 享 很 难 、 排 序 很 难 、 大 众 很 
聪明 、 大 众 并 不 那么 聪明 、 分 而 治之 以 及 端 到 端 。 在 这 六 个 部 分 中 ， 
我 们 看 到 了 很 多 不 同 的 网 络 ， 并 探讨 如 何 将 它们 表示 为 图 形 〈 例 如 网 
页 、 设 备 或 路 由 器 ) 以 及 这 些 图 形 之 上 的 功能 (例如 网 页 级 别 、 分 布 
式 功率 控制 、 路 由 ) 。 


虽然 本 书 至 此 已 经 接近 尾声 ， 但 我 们 布 望 你 的 思维 旅程 将 继续 。 


由 


AN 


同样 重要 的 是 ， 我 们 希望 你 能 牢记 这 些 原则 中 反复 出 现 的 主题 。 
你 也 可 以 考虑 其 中 哪些 在 日 常生 活 中 出 现 。 这 里 是 对 从 过 去 14 章 中 选 
出 的 六 个 主题 的 简短 回顾 : 


。 负 反 馈 发 生 时 ， 网 络 使 用 有 关 其 当前 状况 的 信号 ， 使 其 状态 达 
到 平衡 。 该 主题 多 次 出 现 ， 从 第 1 章 蜂 帘 功 率 控制 ， 到 第 3 章 数 据 定 


价 ， 再 到 第 13 章 互联 网 拥塞 控制 。 
。 正 反馈 与 其 相反 ， 网 络 利 用 正 反馈 放大 其 效果 ， 一 般 


衡 。 

。 分 布 式 协调 在 网 络 中 较 小 的 实体 之 间 分 散 任务 责任 。 即 使 每 一 
个 实体 只 有 网 络 的 本 地 视图 ， 全 局 合作 还 是 有 可 能 出 现 。 这 个 主题 也 
多 次 出 现 ， 从 第 2 章 Wi -Fi 随机 访问 到 第 12 章 互联 网 转发 。 

。 积极 的 网 络 效应 出 现时 ， 更 多 人 加 入 网 络 往往 有 利于 所 有 人 ， 
如 第 9 章 中 提 到 的 例子 和 第 6 章 的 产品 评级 。 

。 消极 的 网 络 效应 与 其 相反 ， 更 多 人 加 入 网 络 往往 会 减损 所 有 人 
的 利益 ， 如 第 3 章 统一 费 府 的 “ 砷 剧 ”。 

。 意见 汇总 在 人 们 的 意见 公正 并 彼此 独立 时 ， 可 以 表现 得 很 好 ， 
如 我 们 在 第 6 章 看 到 的 情况 。 因 此 ， 当 平均 评级 基于 更 多 意见 时 ， 我 
们 更 倾向 于 信任 平均 产品 和 电影 评级 。 

如 果 这 些 主题 留 在 了 你 的 脑海 里 ， 那 么 通过 阅读 本 书 ， 你 已 经 了 
解 到 很 多 关于 网 络 的 力量 的 知识 ! 


与 温 顿 : 蕊 夫 的 对 话 


温 顿 : 瑟 夫 被 公认 为 “互联 网 之 父 ”。 他 与 鲍 勃 : 卡 恩 共同 发 明了 
TCP/IP。 


作者 : 温 顿 ，1974 年 前 后 ， 你 和 同事 一 起 架构 TCP/IP 协 议 时 ， 做 出 
的 最 重要 的 决定 是 什么 ? 


温 顿 : 我 认为 最 重要 的 决定 可 能 是 引入 全 球 寻 址 结构 ， 我 们 称 之 为 
网 络 协议 和 网 络 地 址 。 当 时 ， 我 们 已 经 预见 到 ， 有 多 个 网 络 是 互联 网 形 
成 的 网 络 之 网 络 的 一 部 分 。 我 们 还 知道 ， 大 多 数 网 络 ， 也 许 所 有 网 络 ， 
都 没有 存在 任何 其 他 网 络 的 概念 。 每 个 网 络 都 认为 目 己 是 世界 上 唯一 的 
网 络 。 所 以 ， 在 一 个 特定 的 网 络 上 ， 没 有 办 法 说 “请 发 送 到 男 一 个 网 
络 ”。 鲍 动 : 卡 恩 和 我 在 进行 设计 时 ， 很 快意 识 到 我 们 需要 一 个 方法 来 表 
达 “ 把 这 个 发 送 到 一 个 不 是 你 的 网 络 上 ， 以 使 这 个 网 络 之 网 络 形成 ”。 


第 二 个 决定 不 是 技术 性 的 。 这 是 一 个 方针 决策 : 我 们 当时 是 否 应 该 
在 不 确定 有 多 少 细 市 ， 没 有 任何 限制 ， 也 没有 任何 专利 设计 或 知识 产权 
的 限制 时 公布 这 项 设计 。 


我 们 真 的 考虑 了 这 个 问题 ， 还 记得 我 们 当时 在 为 国防 部 做 这 项 工 
作 。 


国防 部 的 问题 是 ， 建 立 网 络 唯一 方便 的 方法 是 连接 类 似 品 牌 的 机 
器 。IBM 拥 有 把 其 机 融 连 接 在 一 起 的 系统 网 络 架 构 ， 数 字 设 备 公 司 有 一 
种 可 以 将 其 机 器 相连 的 DEC 网 络 系统 ， 惠 普 有 一 种 叫 DS 的 系统 ， 我 想 
它 表 示 分 布 式 系统 ， 同 样 ， 它 只 连接 惠普 的 机 器 。 我 们 认为 ， 国 防 部 不 
必 购 买 茶 种 特定 品牌 的 机 器 ， 就 能 实现 网 络 效应 。 所 以 这 是 第 一 点 ， 意 


味 着 我 们 需要 进行 一 个 非 专 有 的 设计 。 


互联 网 的 前 号 叫 作 阿 由 网 ， 全 称 为 "高 级 研究 计划 普 网 络 ”。 该 网 络 
是 使 用 专用 电话 线路 将 分 组 交换 机 彼此 连接 而 建立 的 。 这 是 一 个 均匀 、 
同 质 的 网 络 ， 由 美国 各 个 机 构 非 常 不 同 的 计算 机 连接 到 上 面 。 这 是 一 个 
专用 电话 电路 和 分 组 交换 机 的 同 质 网 络 。 


当 我 们 意识 到 必须 应 对 所 有 这 些 其 他 的 平台 时 ， 我 们 就 开始 开发 移 
动 无 线 网 络 和 卫星 网 络 ， 以 应 对 移动 车 辆 、 海 上 船舶 和 飞机 通信 的 情 
况 。 但 是 这 样 做 以 后 ， 我 们 意识 到 ， 这 些 不 同 的 分 组 交换 网 络 有 不 同 的 
特点 ， 我 们 必须 找到 一 种 方式 把 它们 连接 在 一 起 ， 使 任何 特定 网 络 中 的 
电脑 不 需要 知道 ， 有 多 少 其 他 网 络 也 是 系统 的 一 部 分 ， 或 流量 是 被 如 何 
路 由 的 。 我 们 只 是 希望 ， 它 能 够 像 消费 者 把 一 张 明 信 片 放 进 邮箱 一 样 ， 
并 期 待 邮政 服务 会 负责 找到 它 该 去 的 地 方 ， 它 应 该 如 何 到 达 那 里 ， 以 及 
什么 时 候 应 该 送 达 。 因 此 ， 在 全 球 运 行 的 意义 上 ， 我 们 模仿 邮政 服务 。 
邮政 服务 使 用 一 种 寻 址 格式 ， 将 信息 从 一 个 国家 传递 到 男 一 个 国家 。 


这 些 可 能 是 最 重要 的 决定 : 公开 发 布 ， 并 消除 任何 影响 采用 的 障 
碍 。 我 们 决定 不 对 设计 的 使 用 施加 任何 知识 产权 限制 ， 免 费 公布 了 所 有 
文件 。 随 着 互联 网 的 发 展 ， 后 来 创建 的 机 构 同 样 对 其 出 版 物 和 技术 规范 
非常 开放 ，40 年 后 的 今天 同样 如 此 。 


作者 : 这 真是 个 有 趣 的 故事 ， 温 顿 ， 也 是 非常 重要 的 决定 ， 直 到 现 
在 都 影响 着 我 们 的 生活 和 工作 方式 。 同 样 有 趣 的 是 ， 你 提 到 了 这 些 地 
址 ， 我 想 继 续 这 个 话题 。 其 中 的 一 个 系统 是 IPv6， 它 是 一 个 更 大 的 地 址 
空间 。 问 卫 v6 转 换 的 进展 如 何 ? 


温 顿 : 这 是 个 好 问题 。 让 我 们 回顾 一 下 ， 我 们 经 历 了 互联 网 设计 的 
多 次 欠 代 ， 确 切 次 是 四 次 。 原 设计 有 一 个 协议 一 一 传输 控制 协议 ， 它 通 
过 多 个 网 络 管理 从 源 主 机 到 目的 主机 的 流量 。 在 设计 、 实 施 和 测试 的 达 
代 过 程 中 ， 我 们 意识 到 ， 实 时 通信 可 能 古 非常 重要 的 。 语 首 、 视 频 和 和 雷 


达 并 不 一 定 要 求 100% 保 证 数据 传输 ， 尤 其 是 考虑 到 这 些 数据 会 动态 更 
新 ， 特 别 是 在 雷达 跟踪 的 情况 下 。 


你 想 要 的 是 低 延 迟 ， 于 是 你 得 到 交互 式 低 延 迟 交 换 。 如 果 有 人 因为 
数据 包 丢失 而 没有 收 到 消息 ， 就 会 要 求 对 方 重复 一 遍 。 于 是 ， 当 你 听 到 
杂音 ， 没 有 听 到 对 方 说 什么 ， 你 会 说 :“ 什 么 ? 请 重复 一 遍 。” 


同样 的 做 法 对 视频 也 成 立 。 你 可 能 会 史 到 故障 ， 有 一 帧 的 一 部 分 没 
有 显示 出 来 。 但 是 妨 一 帧 马上 会 来 ， 所 以 不 必 担 心 重 发 前 一 帧 ， 因 为 用 
户 不 想 看 到 。 如 果 你 尝试 这 样 做 (重新 发 送 ) ， 就 会 增加 双方 之 间 的 延 
述 。 如 果 他 们 正 试图 进行 视频 电话 会 议 ， 那 么 会 议 最 终 将 无 法 继续 ， 因 
为 延迟 在 逐渐 增加 。 


所 以 ， 比 起 让 延迟 增加 ， 我 们 说 ， 让 我 们 允许 数据 包 丢 失 ， 但 要 注 
意 延 迟 。 讨 论 的 结果 是 将 互联 网 协议 〈IP) 和 传输 控制 协议 CTCP) 分 
开 ， 使 其 成 为 系统 中 的 一 个 独特 的 层 ， 不 要 求 进行 序列 可 靠 传 输 。 所 
以 ，TCP 人 负 贡 数据 的 序列 可 靠 传 输 ， 而 IP 只 负 员 将 数据 包 传 递 到 可 能 3 
不 可 靠 的 目的 地 。 这 个 决定 是 TCP 设 计 第 三 次 迭代 前 后 做 出 的 。 


第 二 个 问题 我 们 很 早 就 在 思考 :“ 我 们 应 该 预计 这 个 互联 网 有 多 少 
个 终止 点 ? ”我 们 当时 真 的 不 知道 答案 。 所 以 我 们 的 第 一 个 问题 是 “让 我 
们 看 看 ， 每 个 国家 会 有 多 少 网 络 ? "我 们 想 ， 也 许 每 个 国家 都 会 有 两 个 
国家 级 的 网 络 ， 所 以 会 有 一 些 苋 争 。 然 后 我 们 说 :“ 有 多 少 个 国家 
呢 ? ?我们 不 知道 答案 ， 当 时 也 没有 谷歌 ， 于 古 我 们 猜测 有 128 个 ， 因 为 
这 和 古 2 的 乘 方 ， 程 序 员 就 是 这 样 思 考 的 。 


所 以 我 们 说 :“ 好 吧 ， 我 们 需要 8 比特 的 信息 来 识别 世界 上 的 256 个 
网 络 。” 然 后 我 们 间 ， 有 多 少 计算 机 将 连接 到 每 个 网 络 。 我 们 同样 不 知 
道 答 采 。 但 是 我 们 说 ， 我 们 应 该 大 方 些 。 于 是 我 们 猜 每 个 网 络 有 1 600 
万 合 电 脑 ， 考 碟 到 计算 机 人 花费 数 百 万 美元 ， 在 非常 大 并 装 有 空调 的 房间 
里 运行 ， 这 在 当时 是 非常 惊人 的 。 


所 以 你 可 以 用 24 比 特 的 信息 来 表示 这 么 多 数量 的 机 器 。 我 们 最 终 为 
IPv4 选 择 32 位 地 址 空间 。 它 在 互联 网 上 提供 的 终止 点 总 数 是 43 亿 。 我 必 
须 说 ， 在 1973 年 ， 对 于 互联 网 上 可 能 出 现 的 计算 机 数量 ， 这 似乎 是 一 个 
非常 大 的 数字 。 


于 是 我 们 沿 着 这 条 路 走 下 去 。 但 是 ，1973 年 ， 就 是 鲍 攻 和 我 进行 这 
项 工作 的 同一 年 ， 施 乐 帆 克 研 究 中 心 发 明了 以 太 网。 这 是 一 小 块 同 轴 电 
绕 和 一 些 设备 ， 能 将 当时 的 笔记 本 电脑 或 台式 电脑 以 非常 高 的 速度 共同 
接 入 广播 网 络 ， 当 时 速度 为 每 秒 3Mb， 这 似乎 很 大 。 大 约 在 1980 年 或 
1981 年 后 ， 以 太 网 技术 作为 商业 产品 被 迅速 推广 开 来 。 这 些 网 络 迅速 填 
补 了 互联 网 上 大 量 的 地 址 空间 。 其 结果 是 ， 到 20 世 纪 90 年 代 初 ， 初 始 地 
址 空间 明显 不 足以 满足 再 求 。 


关于 还 需要 多 少 地 址 空间 ， 人 们 有 很 多 争论 。 我 们 认为 32 位 地 址 空 
间 不 够 ， 那 么 应 该 增加 到 128 位 ， 还 是 应 该 选择 电话 号 码 采 取 的 可 变 长 
度 的 寻 址 形式 。 没 有 选择 可 变 长 度 是 有 原因 的 。 于 是 ， 我 们 最 终 选择 
128 位 ， 并 称 其 为 互联 网 协议 IPv6 版 本 。 


到 2015 年 的 这 个 阶段 ， 我 们 进行 这 次 对 话 时 ， 第 4 版 (IPv4) 网 络 
地 址 空间 已 基本 耗 尽 。 当 时 ， 已 经 没有 可 用 的 地 址 空间 。 这 样 说 似乎 有 
些 夸 张 ， 因 为 一 些 负 责 分 配 互联 网 地 址 空间 的 机 构 ， 所 谓 的 区 域 互联 网 
注册 管理 机 构 ， 仍 然 有 一 定数 量 的 地 址 ， 但 不 多 。 大 多 数 地 址 已 经 用 完 
了 ， 没 有 可 用 的 第 4 版 地 址 空间 。 


因此 ，20 世 纪 90 年 代 初 之 后 ， 我 们 意识 到 我 们 将 陷入 困境 ， 于 是 在 
1996 年 前 后 开始 将 IPv6 标 准 化 。 我 们 错误 地 认为 ， 所 有 人 都 会 意识 到 快 
速 实施 IPv6 的 重要 性 ， 这 样 我 们 就 不 会 因为 IPv4 的 限制 而 受到 制约 ， 但 
这 并 没有 发 生 。 当 时 人 们 还 没有 用 完 地 址 空间 ， 最 近 才 用 完 《 在 大 约 
2011 年 ) 。 所 以 ， 与 IPv4 同 时 实施 IPv6 的 步伐 很 慢 。 现 在 我 们 开始 看 到 
它 加 速 ， 是 因为 第 4 版 地 址 基本 上 已 经 消耗 光 了 。 


因此 ， 与 IPv4 并 行 实施 IPv6 的 步伐 加 快 。 我 们 必须 同时 运行 两 个 协 
议 ， 以 迎合 运行 v4 的 旧 群 体 和 运行 v6 的 新 群体 。 我 们 必须 同时 运行 两 个 
协议 ， 因 为 它们 不 能 相互 作用 ， 因 为 你 不 能 把 128 位 的 地 址 放 进 32 位 的 


空间 。 


作者 : 谢谢 你 让 我 们 了 解 迭 代 的 历程 。 它 显示 了 很 多 非常 有 趣 的 架 
构 决 定 ， 比 如 层 的 分 裂 。 你 提 到 TCP/IP 受 到 延迟 和 差错 恢复 权衡 的 驱 
动 ， 也 讲述 了 过 去 几 十 年 互联 网 如 何 扩展 的 有 趣 故 事 。 如 今 ， 信 息 物理 
系统 和 智能 城市 兴起 ， 其 中 有 的 物理 控制 系统 需要 非常 小 和 几乎 不 可 抗 
拒 的 延迟 。 你 认为 这 些 网 络 边缘 或 有 时 在 人 体内 出 现 的 信息 物理 系统 ， 
也 将 迫使 我 们 重新 审视 延迟 问题 吗 ? 


温 顿 : 这 是 一 个 有 趣 的 问题 。 我 想 答 案 可 能 是 ， 因 为 有 些 情 况 下 的 
延迟 得 到 很 好 的 控制 ， 因 为 你 处 理 的 网 络 组 件 距 离 很 近 。 我 们 必须 考虑 
的 是 ， 光 速 延 迟 不 会 消失 。 因 此 ， 无 论 你 如 何 处 理 协 议 ， 都 可 能 有 由 距 
离 造成 的 不 可 减 小 的 最 小 延迟 。 


解决 这 个 问题 的 方法 ， 当 然 是 设计 和 建立 使 用 附近 而 不 是 远程 网 络 
的 系统 。 当 你 有 像 赣 牙 甚 至 Wi-Fi 之 类 的 功能 时 ， 通 常情 况 下 ， 相 互 作 
用 是 局 部 的 ， 因 此 延迟 非常 低 。 所 以 这 种 情况 下 ， 你 不 会 有 问题 。 


另 一 方面 ， 某 些 应 用 程序 可 以 被 设计 为 对 延迟 不 敏感 ， 在 这 种 情况 
下 ， 它 们 可 以 在 几乎 任何 地 方 运行 。 我 看 到 这 两 个 角度 都 存在 于 应 用 程 
序 空 间 中 ， 其 中 一 些 应 用 程序 对 延迟 足够 的 不 敏感 ， 电 子 邮 件 就 是 一 个 
很 好 的 例子 。 但 正如 你 所 说 的 ， 对 于 茶 些 信息 物理 系统 〈 有 时 称 为 物 联 
网 ) ， 你 再 要 低 延 迟 ， 使 应 用 程序 工作 。 


作者 : 我 们 在 这 次 对 话 中 也 提 到 过 ， 有 时 “ 云 ” 需 要 降 到 地 面 并 成 
为 “ 邹 ”， 以 确保 某 些 应 用 程序 的 延迟 非常 小 。 如 今 ， 我 们 在 电视 广告 上 
看 到 不 同 公司 谈论 物 联网 将 如 何 改 变 我 们 的 生活 和 工作 方式 ， 以 及 工 广 
和 农业 将 如 何 运 行 。 你 还 看 到 从 消费 者 穿戴 设备 到 智能 城市 监 图 的 不 同 


对 象 。 你 认为 哪个 更 像 科 约 小 说 ， 哪 个 切实 可 行 ， 并 将 会 发 生 ? 


温 顿 : 改变 发 生 在 各 个 方面 ， 我 认为 这 是 相当 惊人 的 。 有 许多 人 们 
可 以 穿戴 的 设备 ， 谷 歌 眼 镜 是 早期 的 例子 之 一 。 但 Fitbit 等 帮助 记录 人 体 
运动 时 的 生命 体征 的 设备 都 很 常见 。 这 无 疑 已 经 发 生 了 。 还 有 其 他 设备 
正成 为 我 们 生活 的 一 部 分 ， 比 如 有 的 设备 能 让 你 的 笔记 本 电脑 将 信息 发 
送 到 巨大 的 电视 屏幕 上 ， 这 样 你 就 可 以 阐 受 到 更 好 的 视觉 体验 ， 有 网 络 
功能 的 旭 探 融 等 可 以 让 你 远程 控制 温度 ， 或 了 解 并 确定 房子 的 状态 ， 也 
许 为 了 确保 房子 无 损 ， 你 还 可 以 看 一 下 摄像 机 。 


各 种 各 样 像 这 样 的 事情 正在 发 生 ， 我 认为 在 接 下 来 的 几 十 年 里 ， 我 
们 将 看 到 各 个 方面 的 高 速 进步 。 所 以 老实 说 ， 我 不 认为 这 是 科 约 小 说 。 
甚至 我 们 在 谷歌 研发 的 自动 驾驶 汽车 也 不 再 是 科幻 小 说 ， 因 为 它们 实际 
上 已 经 上 路 了 。 


但 我 担心 的 一 件 事 是 ， 许 多 这 些 设备 在 设计 和 制造 时 ， 可 能 只 有 相 
对 较 小 的 处 理 能 力 。 问 题 是 ， 例 如 ， 它 们 是 否 有 足够 的 处 理 能 力 来 加 密 
流量 ， 以 确保 数据 的 隐私 。 我 们 应 该 非常 关注 这 些 系统 的 安全 性 、 保 密 
性 和 私密 性 ， 因 为 收集 到 的 大 量 数据 可 以 被 解读 和 小 用。 举 个 例子 ， 如 
果 你 的 房子 周围 有 一 堆 温 度 传 感 费 ， 别 人 束 可 以 通过 连续 的 监测 来 了 
解 ， 有 多 少 人 住 在 房子 里 ， 他 们 在 哪里 ， 日 第 生活 习惯 是 什么 ， 什 么 时 
候 在 家 ， 什 么 时 候 不 在 家 。 


因此 ， 我 们 在 信息 物理 系统 中 面 对 很 多 安全 性 、 保 密 性 和 私密 性 的 
挑战 ， 一 切 的 互联 网 空间 都 需要 一 些 非常 严肃 的 研究 和 开发 ， 以 克服 或 
防止 这 些 信息 物理 设备 的 潜在 小 


作者 : 你 提 到 的 信息 隐私 确实 是 许多 人 越 来 越 关注 的 问题 ， 特 别 是 
当 它 可 能 涉及 物理 对 象 时 。 当 我 们 购买 连接 “物品 *”， 不 知道 它们 的 安全 
功能 什么 时 候 会 过 时 ， 我 们 应 该 担心 这 个 问题 吗 ? 


温 顿 : 我 们 当然 应 该 担心 这 个 问题 。 事 实 上 ， 如 果 设 备 无 法 持续 更 
新 ， 以 修复 使 用 中 的 错误 ， 从 而 导致 漏洞 ， 我 认为 就 不 应 该 买 ， 更 不 用 
说 销售 。 我 担心 会 出 现 “100 000 台 冰箱 袭击 美国 银行 ”那样 的 新 闻 标 题 ， 
因为 它们 感染 了 恶意 软件 ， 并 发 起 这 种 拒绝 服务 攻击 。 我 们 有 非常 重要 
的 技术 工作 要 做 ， 以 确保 设备 只 由 授权 方 控 制 ， 它 们 积累 的 数据 只 问 授 
权 方 开放 访问 。 我 们 最 终 几 乎 肯定 会 不 得 不 使 用 加 密 技 术 ， 以 便 进行 强 
身份 验证 ， 并 保护 数据 的 机 密 性 ， 例 如 ， 可 能 会 将 数据 从 信息 物理 系统 
中 的 设备 移动 到 其 他 某 个 监控 系统 。 


作者 : 我 还 想 问 你 更 多 的 问题 : 互联 网 周围 有 一 个 巨大 的 应 用 生态 
系统 。 你 最 喜欢 的 应 用 程序 是 什么 ? 


温 顿 : 这 是 个 很 有 趣 的 问题 ， 因 为 每 当 有 人 说 起 应 用 程序 时 ， 我 当 
然 会 认为 这 表示 移动 程序 。 我 意识 到 你 的 问题 并 不 是 我 想 的 这 么 狭 赠 。 


所 以 ， 老 实说 ， 我 使 用 得 最 多 的 服务 其 实 是 谷歌 。 这 不 是 因为 我 在 
谷歌 工作 ， 只 是 因为 在 网 上 寻找 东西 是 非常 有 价值 ， 也 是 非常 困难 的 ， 
而 谷歌 使 其 变 得 容易 ， 并 频频 给 出 我 寻找 的 答案 。 


我 使 用 应 用 程序 定期 跟踪 股票 市 场 和 我 目 己 的 投资 组 合 。 我 目 己 使 
用 流 媒 体 视 频 ， 要 么 看 吸引 我 注意 的 YouTube 卢 段 或 网 电影 。 在 有 足 
够 带宽 来 文 持 在 线 播 放 音 频 和 视频 的 地 方 ， 这 些 应 用 程序 非常 流行 。 


所 以 对 我 来 说 ， 这 些 都 是 方便 收集 信息 的 应 用 程序 。 我 在 网 上 看 报 
纸 ， 而 不 是 在 家 看 纸 质 报 纸 ， 每 天 都 是 这 样 。 我 是 一 个 电子 邮件 的 忠实 
用 户 ， 我 的 许多 同事 和 同龄 人 也 是 。 尽 管 还 有 其 他 交流 方式 ， 比 如 发 短 
信 、 脸 书 或 Google+， 但 它们 都 没有 电子 邮件 的 使 用 频率 高 。 最 后 ， 我 
发 现 最 近 几 年 视频 会 议 的 使 用 越 来 越 多 ， 这 和 盈 不 多 就 是 我 们 现在 做 的 。 
这 是 一 个 了 不 起 的 进步 ， 因 为 谷歌 环 聊 允 许多 方 同时 互动 ， 使 人 们 可 以 
进行 远程 会 议 ， 这 几乎 使 避免 出 兰 成 为 可 能 。 


我 使 用 的 男 一 个 应 用 程序 是 谷歌 文档 系统 的 文档 、 电 子 表格 、 文 本 
文件 和 演示 文 稳 。 特 别 是 与 视频 会 议 应 用 相连 的 文本 文档 ， 它 其 实 是 一 
个 非常 强大 的 组 合 。 我 与 男 外 两 三 个 作者 合作 写 论 文 ， 我 们 在 里 面 同时 
交谈 ， 既 可 能 看 到 对 方 ， 也 可 以 同时 编辑 一 个 共享 文件 。 与 让 一 个 人 负 
责编 辑 文本 不 同 ， 在 这 里 任何 人 都 可 以 和 目 由 地 编辑 并 吸引 其 他 人 关注 。 
由 于 这 是 实时 的 讨论 ， 我 们 发 现 ， 比 起 互相 之 间 发 送 电子 邮件 附件 ， 这 
种 方式 会 让 完成 最 终 文件 的 速度 快 得 多 。 所 以 ， 这 种 以 合作 的 方式 同时 
实时 工作 的 能 力 是 非常 强大 的 。 


作者 : 温 顿 ， 谢 谢 你 与 我 们 分 享 你 的 见解 。 
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